黄仁勋、马斯克背书 世界模型何以成为通往物理AI的钥匙?
2025-11-01 23:23:55 来源:财联社
如何让具身智能成为真正的物理AI?世界模型或是答案
怎样才能让具身智能转变为真正的物理AI呢?答案也许是世界模型。
在不久前的GTC大会上,黄仁勋在谈到物理AI时,分享了运用Omniverse数字孪生技术来训练和打造机器人的方法。这一思路可以回溯到今年年初,当时他在CES 2025主题演讲里提到,世界模型是实现物理人工智能的关键要素,它能助力AI理解物理世界的规则,进而实现机器人、自动驾驶汽车等设备的自主操控。
基于类似的理念,10月26日,特斯拉推出了自研的神经网络世界模型(World Simulator),还附上了多个演示视频。其中一个视频以第一人称视角记录了机器人在3D数据合成环境中四处走动的过程。特斯拉宣称,Optimus正在神经网络世界模型中接受训练,它能够在100%仿真的环境下学习,并将模拟训练的策略应用到现实世界中。
那么,什么是世界模型呢?与广义的AI模型不同,世界模型并非借助可获取的语言、图像和视频来理解现实场景,而是通过大量数据学习现实世界的物理规则,进行因果推理,从而预测和生成符合现实规律的未来。其最终目标是,通过训练让人工智能适应现实世界而非理论世界,使AI进化为物理AI。
正如图灵奖得主、Meta首席AI科学家杨立昆所说:“我们不是在制造会说话的机器人,而是在制造会思考的物理实体。”
当下,世界模型的理念已成为科技巨头乃至整个科技界的共识:xAI从英伟达挖走专家,专注于研发用于游戏领域和机器人系统的世界模型;Meta发布了代码世界模型(Code World Model),探索如何利用世界模型提升AI代码生成性能;“AI教母”李飞飞筹集2.3亿美元创立的世界模型初创公司World Labs,开发出了一款能够渲染持久且一致3D世界的实时框架模型(RTFM)。
世界模型为何能吸引人工智能先驱们竞相投入呢?这或许与具身智能本身存在的争议有关。宇树科技CEO王兴兴曾着重指出:“目前机器人未能达到智能水平,最大的问题在于模型,而非数据。”东吴证券指出,作为具身智能的核心,AI模型的技术路线仍处于探索阶段,并且已成为机器人等终端产品大规模应用的最大阻碍。
世界模型的优势恰恰在此得以体现。根据弗若斯特沙利文近期发布的《2025年中国世界模型发展白皮书》,具身智能意味着AI从单纯的信息处理向与物理世界的交互转变,其所需要的数据需整合文本指令、多视角视觉、物理交互等多维度信号,复杂程度远超纯文本或单一视觉模式。而世界模型能够生成视觉逼真、物理精确的合成数据,有效弥补传统仿真数据与真实世界之间的差距。
据该机构统计,当前超过80%的自动驾驶算法借助世界模型进行辅助训练,它已经推动自动驾驶系统持续学习、自主验证并快速迭代优化。
在国内世界模型研发进展方面,宇树、智元等人形机器人厂商处于领先地位。今年9月,宇树开放了UnifoLM - WMA - 0世界模型架构,用于提高物理环境中的学习与执行效率,并为未来与更复杂模型的融合预留了工程接口。智元则在今年8月发布了行业首个机器人世界模型开源平台Genie Envisioner,旨在让机器人在同一世界模型中完成从“看”到“想”再到“动”的端到端推理与执行。
与此同时,其他机器人机构也动作不断。日前,湖北人形机器人创新中心发布了具身基础模型GigaBrain - 0,其背后采用了世界模型平台GigaWorld生成数据。同样在今年,北京人形机器人创新中心和成都人形机器人创新中心先后发布了全新的世界模型架构WoW,以及国内首个基于世界模型的机器人任务执行系统R - WMES。
不过,作为一种技术路径,世界模型的研究仍处于起步阶段。东吴证券认为,世界模型代表着具身智能算法层最前沿的探索方向,预计具身智能大脑市场将成为具身智能市场中发展最快、技术难度最高且最为关键的环节。
从投资角度来看,国投证券表示,结合物理AI和世界模型所需运用的技术和环节,仿真、感知以及机器人厂商将从中受益,建议关注:1)已经拥有物理AI产品的国内CAE(计算机辅助工程)厂商;2)为世界物理模型提供技术支持的3D感知厂商;3)提供工业数字孪生解决方案的厂商。
(文章来源:财联社)
原标题:黄仁勋、马斯克背书 世界模型何以成为通往物理AI的钥匙?
郑重声明:信查查发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担



