如果有100亿怎么花?8位具身智能大佬现身回答
2025-11-24 23:16:30 来源:蓝鲸新闻
在资本与技术密集的具身智能赛道,百亿资金能否撬动未来人与机器人共生的局面?
11月20日智源具身OpenDay“具身模型会客厅”现场,八位产学研领军者针对这个颇具张力的问题,展开了一场关于战略抉择与产业路径的思辨。
若有100亿元推进具身智能,这笔资金如何使用?
在圆桌讨论现场,主持人甲子光年创始人张一甲提出一个更具洞察力的问题:“若手里有100亿元推进具身智能,这笔钱该怎么花?”
中国科学院大学教授赵冬斌风趣地将问题抛给产业界同仁:“这是资金方面的问题,让他们来回答(笑)。”这巧妙地预示了随后的精彩交锋。
“首先,100亿并不够。”加速进化创始人程昊紧接着直言不讳地修正问题前提:“若我只有100亿,肯定不会独自埋头落地,而是会找更多伙伴,比如投资智源研究院,吸引全球研究人才,使他们能专注于长期的技术突破。”
智源研究院院长王仲远积极回应。“我很赞同程昊总的回答,”他表示,并给出业界标尺:“100亿听起来多,实际也就10亿多美元。GPT - 3开始训练时,微软的投资规模也是这个量级。”
“100亿并非关键,”北京大学助理教授王鹤强调,他将“愿景引领”置于资金之上,“重要的是如何凭借事业和坚定进步吸引人才加入。我们期望大家为未来人与机器人共生的世界努力,而非仅为钱。”
自变量创始人王潜将话题拉回现实竞争维度,答案简洁有力:“首先吸纳市场上优秀人才,这是首位。其次是算力和数据。”
智元机器人合伙人罗剑岚展现宏大技术构想:“我会构建世界最大的能自我进化、自我闭环的数据系统。”他指出关键意义:“100亿可说多也可说不多,但关键是首个投入百亿做此事的个人或机构尚不存在。”
清华大学助理教授星海图首席科学家赵行称:“我也会构建最大的‘data engine’,目标是将物理世界信息全部数字化。”
最后,招商局集团AI首席科学家张家兴从模型架构层面为讨论提供收敛方向。他说:“我希望设计出属于我们的具身智能‘黄金式模型’,然后大规模预训练,提升能力,找到正确路径。”
架构之争:具身智能的“Transformer”终局思辨
对于具身智能未来是否会收敛到某种统一架构,众人也给出了思考。
中科院大学教授赵冬斌认为,“当前具身模型训练方法多样,”通过预训练、后训练等方式,模型在多项任务中展现通用能力。“未来可能出现收敛的单一模型,也可能保持模型多样化路径,两种情况都有可能。”
那么,最可能的收敛路径是什么?招商局集团AI首席科学家张家兴率先描绘颠覆性蓝图。“如同人类智能演进:先有动作能力,再发展视觉,最后诞生语言。”他指出,当前主流的VLA(视觉 - 语言 - 动作)架构在视觉和动作间插入语言模块,不符合人类操作本质逻辑。“开车时能边说话边驾驶,说明视觉和动作间有直接通路。本质上,期待大模型领域实现范式转换:从‘language first’转向‘vision first’或‘vision - action first’。”
清华大学助理教授赵行对此深表认同。“确实需要与大语言模型平行的基础模型,可能是‘大型行动模型’。”他阐述,该模型应基于视觉,融入语言能力,符合生物进化规律。他还指出具身智能模型与大语言模型关键区别:“大语言模型是开环的——用户提问,模型回答,流程结束。具身智能不同,执行动作后会立即获得世界反馈并调整自身行为,所以必须是能与环境实时交互、持续调整的闭环模型。”
然而,收敛之路并非一帆风顺。智元机器人合伙人罗剑岚提出“系统论”视角:“智能问题更可能由完整系统解决,而非单一模型。系统包括VLA、世界模型、强化学习等核心要素,整合形成真正闭环系统。”
智源研究院院长王仲远从数据基础角度给出收敛前提。“这种模型所需数据量极大,”他坦言,“可能要等更多机器人真正落地……出现‘具身智能的互联网’,有了数据基础,才可能有更好的大一统模型。”虽路径漫长,但他强调:“长期看,这是必须突破和解决的关键问题。”
北京大学助理教授王鹤将挑战指向数据瓶颈:“如今研发‘行动优先’模型,核心问题是:全球处于前沿场景运行的人形机器人可能仅有约一千台甚至更少。数量如此之少,不足以支撑探索成熟架构与模型。”他提出,短期靠仿真模拟,长期依赖“人形机器人数量”持续高速增长。
在讨论具体技术路径时,自变量创始人王潜提出更本质观点:“‘Transformer’说法可能有误导性,它只是架构组件。如同建造大楼,Transformer可能是砖块或钢筋,可替换。更重要的是设计建筑整体结构与功能。”他从语言模型发展中提炼两条核心经验:一是数据质量优于数据总量;二是通用模型(通才模型)能捕捉任务间“共同结构”或本质规律。他甚至大胆预测:“不久后,真正主导的多模态模型可能由具身智能推动发展……反过来主导甚至取代现有多模态范式。”
正如赵冬斌教授最后总结的:“输入模态远比互联网大模型丰富,输出也有多种实现路径。目前业界发展迅速,从学界看,仍处于百花齐放状态。”
而这正是爆发前夜的典型特征——在通往终局的路上,充满分歧的思辨往往比表面共识更能推动领域前行。所有人都期待具身智能“ChatGPT时刻”的范式革命早日来临。
(文章来源:蓝鲸新闻)
原标题:如果有100亿怎么花?8位具身智能大佬现身回答
郑重声明:信查查发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。



