小参数、高速度!罗福莉首秀解说AI新成果 从“不做大模型”到一年开源多款,小米为何改了主意?
2025-12-17 18:47:01 来源:每日经济新闻
一向偏好“突然发力”的小米又有新动作!
12月17日,2025小米“人车家全生态”合作伙伴大会于北京国家会议中心举行。会上,Xiaomi MiMo大模型负责人罗福莉首次登台,正式发布开源Xiaomi MiMo-V2-Flash大模型。
据罗福莉介绍,该模型在多数评测基准上超越了DeepSeek V3.2和K2-Thinking,在全球处于相近水平的顶尖模型速度与成本象限中达成了低成本、高速度,且初步具备模拟世界的能力。
从2023年5月公开表示“不会做OpenAI类的大模型”,到悄然组建大模型团队、试探性开源首个小参数模型;再到高薪从DeepSeek“挖角”,推出可与顶级模型媲美的产品,小米这一系列变化背后,反映出大模型从初期热衷于“卷参数”,到如今逐渐转向“卷落地”的现实状况。
在业内人士看来,小米若想稳固头部厂商的地位,除了守好手机和汽车业务的“护城河”,AGI(通用人工智能)这条道路也需涉足,而自研大模型便成为不可或缺的一步。
2025小米“人车家全生态”合作伙伴大会现场 每经记者杨卉摄
罗福莉:小米开源大模型已达TOP2级别
12月17日上午,《每日经济新闻》记者在2025小米“人车家全生态”合作伙伴大会现场留意到,此次活动热度颇高,现场人头攒动,主论坛开场前甚至满员,不再允许人员进入。不过,小米创始人兼CEO雷军此次并未现身。
活动伊始,小米集团合伙人、集团总裁卢伟冰率先登台,上台便提及小米刚开源的大模型,但他也卖了个关子,表示稍后会有专人讲解细节。
卢伟冰在大会上进行讲解 每经记者杨卉摄
据卢伟冰介绍,未来五年,小米集团研发投入预计将超2000亿元,其中2026年研发投入预计约400亿元。卢伟冰还详细剖析了小米的“人车家生态”:产品涵盖个人设备、出行设备、家庭设备;核心技术包含芯片(chip)、OS(操作系统)、AI(人工智能);智能制造涉及手机、汽车、大家电工厂。
卢伟冰所说的“专人”,正是原DeepSeek核心成员,被业内称作“天才少女”的罗福莉。今年11月12日,罗福莉在朋友圈正式宣布加入小米Xiaomi MiMo团队。此次也是她作为小米MiMo大模型负责人首次登台演讲。
演讲过程中,罗福莉全程围绕技术展开。据她介绍,Xiaomi MiMo-V2-Flash是小米专为极致推理效率自研的模型,通过引入Hybrid(混合架构)注意力架构创新及多层MTP(一种模型架构)实现推理加速。API(应用程序编程接口)定价为:输入0.7元/百万tokens(大模型处理文本的最小单位);输出2.1元/百万tokens。
罗福莉称,研发初期团队主要围绕三个问题开展工作:智能体必须拥有高效的沟通语言,即代码能力和工具调用能力;目前智能体之间的沟通带宽极低,该如何提升带宽;如何激发后训练的潜能。
在小米看来,超强的代码和工具调用能力是Agent(智能体)沟通的高效“语言”,围绕极致推理效率设计的模型结构是“高带宽”Agent协作的关键,全新后训练范式则能够确保高效稳定的扩展强化学习训练。
模型参数方面,罗福莉直言,Xiaomi MiMo-V2-Flash是一个规模较小的模型,总参数仅有309B,激活参数只有15B。“我甚至都不愿称它是一个非常大的模型。”
而在代码能力方面,罗福莉表示Xiaomi MiMo-V2-Flash的代码能力和Agent测评基准测试已达全球开源模型TOP2,在多数评测基准上超越了DeepSeek V3.2和K2-Thinking,同时对比参数量减少了1/2至2/3。在全球处于相近水平的顶尖模型速度和成本象限里实现了低成本和高速度,且已初步具备模拟世界的能力,如通过HTML(超文本标记语言)编写操作系统、模拟太阳系、绘制一幅圣诞树等。
罗福莉作为小米MiMo大模型负责人首次登台演讲 每经记者杨卉摄
谈及AGI(通用人工智能)的未来方向,罗福莉称希望能完善缺失的演化拼图。
在她看来,算力和数据并非最终的护城河,真正的护城河是科学的研究文化与方法,以及将未知问题结合模型优化转化为可用产品的能力。
罗福莉进一步表示,下一代智能体系统并非“语言模拟器”,而是真正理解人类世界并与之共存的“智能体”。在Agent执行能力方面,应实现从“回答问题”到“完成任务”的转变,具备记忆、推理、自主规划、决策、执行等能力。从Omni(全能)感知角度看,应实现统一多模态感知,为理解物理世界奠定基础,从而更好地融入眼镜等智能终端,融入用户的日常工作流程。
罗福莉作讲解 每经记者杨卉摄
演讲结尾,罗福莉回忆了自己2020年刚进入大模型领域时的经历。“那时国内的开源模型与世界顶尖闭源模型的差距,我认为至少有3年。但如今大家都能看到,中国像DeepSeek、MiMo等的开源模型,与世界顶尖闭源模型的差距可能仅有数月。”
谈到开源的价值,罗福莉称,它不仅是分享了模型和代码,更是实现AGI的普惠化,是确保所有人类智慧共同进化的唯一途径。
三年间,小米对大模型的态度发生巨大转变
实际上,小米最初对自研大模型的热情并不高。
2023年5月底,小米集团公布了当年第一季度业绩。彼时,卢伟冰在电话财报会上称,尽管大厂都在进行“大模型竞赛”,但小米集团不会做OpenAI类的大模型。
虽有此表态,但实际上在同年4月,小米已悄然组建AI实验室大模型团队,着手研发“自产自销”的端侧模型。
那时,国内厂商还在“百模大战”中苦苦挣扎,竞争集中在参数大小、文本长度、中文理解能力等方面,变现落地尚遥不可及。需注意的是,此时距离小米推出首车的时间已不到一年,集团上下的注意力都被造车“紧紧抓住”。
2024年3月,小米发布首款车型SU7。同年下半年,就在小米新车热度居高不下的同时期,国产大模型DeepSeek已开始展现变现能力,各类搭载DeepSeek的终端产品,如一体机、App(应用程序)、智能眼镜等纷纷涌现。
那段时间,被各类“造车”消息充斥的小米已鲜少公开谈论大模型。直到2024年年底,业内传出消息,称小米正着手搭建自己的GPU(图形处理器)万卡集群,将大力投入AI大模型研发。
进入2025年,产业格局发生变化,国内大模型从“卷”参数、“卷”模型进入到“卷”落地应用的“后半程阶段”。与此同时,观望已久的小米,最终还是踏入了AGI领域。
今年4月30日,小米突然宣布开源其首个推理大模型Xiaomi MiMo,同时公开了一个此前未曾露面的团队:小米大模型Core团队。
按照小米自己的说法,2025年看似是大模型逐梦的后半程,但公司坚信AGI征程依然漫长。为了踏上这条漫长道路,彼时的小米还发布了大量与大模型相关的招聘信息,如“大模型算法专家”“大模型推理工程师”“大模型数据策略工程师”等,其中年薪最高可达128万元,落地场景包括智能门锁、智能音箱、AI面试、AI会议助理等。再往后的时间线便是今年11月,雷军“挖人”成功,罗福莉发朋友圈官宣加入小米。
截至目前,小米在年内已开源多款大模型。
从财报数据来看,小米集团今年前三季度业绩颇为亮眼,小米汽车还首次实现了单季度经营盈利(毛利减去经营开支)。然而深入剖析,小米当前面临的压力不小。
手机业务方面,存储价格持续攀升,终端厂商压力增大,小米也坦言明年市场的压力会超过今年,预计友商的相关产品零售价会有较大幅度上涨。汽车方面,受购置税补贴及产业竞争的影响,预计明年小米汽车的毛利率可能出现同比下滑的情况。
在业内人士看来,一方面,小米确实需要更多的增长动力;另一方面,当前各类厂商都在跨界AI,不少还喊出“All in”口号,要稳固头部厂商地位,自研大模型必定是小米不可缺失的一步。
(文章来源:每日经济新闻)
原标题:小参数、高速度!罗福莉首秀解说AI新成果 从“不做大模型”到一年开源多款,小米为何改了主意?
郑重声明:信查查发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。



