英伟达发布Cosmos-Reason1系列:AI物理通识新突破,引领智能科技新篇章

随着科技的飞速发展,人工智能(AI)在各个领域的应用越来越广泛。然而,AI在处理物理环境方面的能力仍然有限,面临着诸多挑战。为了应对这一难题,英伟达推出了全新的Cosmos-Reason1系列模型,这一创新举措无疑将为智能科技领域开启新的篇章。

首先,我们需要理解AI在物理环境中的挑战。AI在语言处理、数学和代码生成等领域取得了显著进步,但将其能力扩展到物理环境仍面临诸多困难。在物理环境中,AI需要依赖视频等感官输入,结合现实物理法则生成反应,涉及导航、操作和交互等任务,这需要AI具备常识推理和对空间、时间及物理规律的具身理解。然而,目前AI在连接物理世界方面仍然薄弱,无法直观理解重力或空间关系,导致在具身任务中表现不佳。

为了解决这一难题,英伟达推出了全新的Cosmos-Reason1系列模型。该系列模型分为Cosmos-Reason1-7B和Cosmos-Reason1-56B两个版本,通过两个阶段的训练,即Physical AI Supervised Fine-Tuning(SFT)和Physical AI Reinforcement Learning(RL)。这一创新的训练方式,使得模型能够更好地理解和适应物理环境。

为了训练这些模型,研究团队引入了双本体系统。一个分层本体将物理常识分为空间、时间和基础物理三大类,细化为16个子类;另一个二维本体则映射人类、机械臂、人形机器人等五种具身代理的推理能力。这样的设计使得模型能够更好地理解和处理物理环境中的各种情况。

模型架构采用了大型语言模型(LLM),结合视觉编码器处理视频数据,实现文本和视觉数据的同步推理。训练数据包含约400万条标注视频-文本对,涵盖动作描述和复杂推理任务。这些数据经过精心挑选和标注,以确保模型能够获得足够的物理常识和具身推理能力。

为了构建针对物理常识的基准测试,研究团队创建了604个问题,包含426个视频。这些问题涵盖了各种物理常识,如力学、电学、光学等,为评估模型的物理推理能力提供了良好的标准。同样,针对具身推理的基准测试也包含610个问题,600个视频。这些问题涉及到各种具身任务,如预测行动、验证任务完成和评估物理可行性等。

在基准测试中,Cosmos-Reason1系列模型表现出色。特别是在经过RL训练后,模型在预测下一步行动、验证任务完成和评估物理可行性等方面取得了显著进步。这些成果充分证明了Cosmos-Reason1系列模型在AI物理通识方面的新突破。

总的来说,英伟达发布的Cosmos-Reason1系列模型是一次AI在物理通识方面的重大突破。该系列模型通过创新的训练方法和强大的数据处理能力,为机器人、自动驾驶车辆等领域带来了实际应用潜力。这一创新成果无疑将推动智能科技领域的发展,引领我们进入一个全新的智能时代。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

本文来源于极客网,原文链接: https://www.fromgeek.com/ai/687270.html

分类: 暂无分类 标签: 暂无标签

评论