“王者归来”之后谷歌再下重注：世界模型将迎来“ChatGPT时刻”

当前位置：首页 > 新增资讯 > “王者归来”之后谷歌再下重注：世界模型将迎来“C...

“王者归来”之后谷歌再下重注：世界模型将迎来“ChatGPT时刻”

2025-11-22 09:46:18 来源：科创板日报

据《科创板日报》11月22日讯，Gemini 3 Pro刚亮相，Nano Banana Pro便紧接着登场。短短几天，谷歌这两款新品在全球AI圈掀起波澜，上演了一场“王者归来”的好戏。

这两款模型均出自DeepMind。眼下Gemini和Nano Banana的热度尚未消退，DeepMind已投身下一个方向。在最新采访中，DeepMind首席执行官兼联合创始人戴密斯·哈萨比斯直言，世界模型是通往AGI的关键部分。

“世界模型是目前我投入时间最多的领域。你可能知道前几天发布的SIMA 2（注：谷歌一款基于Gemini技术的3D虚拟世界AI智能体），我有时会把它称作‘在Genie思维中玩的SIMA’。这些东西让我着迷，我觉得它们将是实现AGI的关键组件。它们在底层使用Gemini，但有各种扩展。”

目前，谷歌内部已将世界模型用于训练其他智能体及机器人，哈萨比斯认为，世界模型会有很多内部研究用例，也会出现一些出色的外部应用。

当被问及世界模型是否会迎来“ChatGPT时刻”时，哈萨比斯给出肯定答复，但只有解决了高昂的推理/服务成本瓶颈，并具备保持长时间一致性的能力后，世界模型才能迎来真正的爆发时刻。

哈萨比斯提到的Genie，是谷歌世界模型的“代表作”。短短一年半时间，DeepMind就将Genie从2D升级到能实时生成交互式3D环境的Genie 3。只需一句话，Genie 3就能在720p分辨率下创建一个用户可边走边看的动态世界，场景细节能在长达一分钟的记忆中保持连贯。除游戏外，Genie 3还能为机器人或自动驾驶系统提供多元化训练场景，可为AI智能体研究提供更长、更稳定的交互回合。

▌让AI“读懂”世界，还是“看懂”世界？

当下，对“世界模型”的追求在硅谷研究一线迅速蔓延。

Meta公司首席人工智能科学家、图灵奖得主杨立昆本周三正式宣布，将于年底从Meta离职。他计划创立一家专注于“世界模型”技术的初创公司，该技术旨在突破网络数据的局限，通过分析更广泛信息来更准确地呈现物理世界及其特性。

AI教母李飞飞也是世界模型的支持者，其创业公司WorldLabs一周前推出首款产品Marble，由多模态世界模型驱动，这个被其称为“构建空间智能未来的基础”的产品，能从一张图片、一段视频或一句话中构建持久的3D世界。

英伟达此前也已推出世界基础模型开发平台Cosmos，可帮助开发者直接生成合成数据，用于自动驾驶和机器人研究训练。

从本质上讲，这背后涉及AI最核心、最本质的分歧——想实现真正的AGI，是让AI通过文字“读懂”世界，还是让AI“看懂”世界？

“读懂派”代表如OpenAI，认为只要堆砌足够多的数据资料，智能就能自动涌现；“看懂派”则觉得大语言模型充其量只是强大的文本数据库，记住了海量文本，却完全不理解文本背后的物理世界。用李飞飞的话来说，世界模型能让“看见”晋升为“推理”，让“感知”转化为“行动”，让“想象”落地为“创造”。

必须承认，与“读懂派”交出的ChatGPT、Sora等已引发全球轰动的模型相比，世界模型领域目前确实缺乏现象级消费产品，谷歌的Genie几乎是唯一表现惊艳的案例。在这种情况下，这条路难免面临“雷声大、雨点小”的质疑，甚至被部分舆论判定为“皇帝的新衣”。

但这是否意味着世界模型前途黯淡？下结论还为时过早。

大语言模型的成功，某种程度上建立在海量公开文本和代码的“喂食”上；而构建一个能理解并推演物理规律的世界模型，底层挑战无疑更为艰巨。这项技术仍处于初期爬坡阶段，它需要的或许不是即刻的喝彩，而是更多的耐心与时间。

（文章来源：科创板日报）

原标题：“王者归来”之后谷歌再下重注：世界模型将迎来“ChatGPT时刻”

郑重声明：信查查发布此内容旨在传播更多信息，与本站立场无关，不构成投资建议。据此操作，风险自担。

“王者归来”之后谷歌再下重注：世界模型将迎来“ChatGPT时刻”

相关企业

热门企业

“王者归来”之后 谷歌再下重注：世界模型将迎来“ChatGPT时刻”

相关企业

热门企业

“王者归来”之后谷歌再下重注：世界模型将迎来“ChatGPT时刻”