远超外界预期?谷歌最新大模型Gemini 3横扫各大榜单,马斯克、奥特曼接连点赞
2025-11-19 21:18:47 来源:澎湃新闻
备受瞩目的谷歌旗下大模型Gemini 3终于问世,并未辜负众人期望。
当地时间11月18日,谷歌母公司Alphabet正式推出新一代多模态AI模型Gemini 3,涵盖Gemini 3 Pro和增强型推理模式Gemini 3 Deep Think两个版本,还带来了全新AI agent(助理)开发平台Google Antigravity。
谷歌CEO桑达尔·皮查伊(Sundar Pichai)称,Gemini 3“拥有最先进的推理能力,能够领会深层次内容与细微差别——无论是察觉创意中细微的线索,还是剖析复杂难题中相互交织的结构维度”。
据介绍,Gemini 3在核心能力上取得显著突破。该模型基于谷歌TPU进行训练,支持100万个token的上下文窗口,适用于需要Agent、高级编程、长上下文、多模态理解、算法开发等功能的应用。
目前,Gemini 3 Pro已登上国际权威评测平台LMArena排行榜榜首。同时,该模型在用于检测AI事实准确性的SimpleQA Verified基准测试中斩获了当前最高的72.1%得分。
在用于测试AI系统是否具备博士级推理能力的“人类最后的考试”(Humanity's Last Exam)中,Gemini 3在不使用任何工具的情况下达到了37.5%的准确率;而在考察研究生水平科学问题理解能力的GPQA Diamond基准测试中,其得分更是高达91.9%。
Gemini 3 Pro的基准测试成绩。来源:谷歌
此次发布距离上一代Gemini 2.5过去了8个月,离Gemini 2.0的发布过去了11个月。皮查伊在公司博客文章中写道:“如今,每月有20亿用户使用AI概览(谷歌搜索的AI Overviews功能)。Gemini app的月用户量已突破6.5亿......令人惊叹的是,仅仅用了两年时间,AI已从单纯的文本和图像识别,发展到能够‘洞察语境’。”
谷歌实验室与Gemini副总裁JoshWoodward表示,Gemini 3是谷歌有史以来“最出色的氛围编程(vibe coding)模型”,使软件开发人员能够通过提示词生成代码。谷歌方面还强调,Gemini 3 Pro的回复“智能、简洁、直接,用真知灼见取代了陈词滥调和奉承”。
分析指出,随着Gemini 3的发布,谷歌与OpenAI之间的竞争愈发激烈。
Gemini 3发布后,OpenAI联合创始人兼CEO山姆·奥特曼(Sam Altman)和xAI创始人、CEO埃隆·马斯克(Elon Musk)都发来“贺信”。奥特曼在X(原推特)平台上评价称“Gemini 3看起来很不错”,而马斯克在表示祝贺的同时还写道: “看来我们要抓紧发布Grok 4.20了。”
有趣的是,硅谷科技播客主持人约翰·库根(John Coogan)指出,面对Gemini 3带来的挑战,其竞争对手的反应各异:Anthropic在当天宣布和英伟达、微软达成新的合作协议,三家一同“抱团取暖”;以前最喜欢在谷歌发布会前“搞事情”的OpenAI这次却格外沉默,而马斯克则代表xAI直接道出了心中的焦虑。
交易公司Jones Trading的首席市场策略师Mike O'Rourke表示:“鉴于谷歌的规模、影响力以及在搜索领域的先发优势,Gemini可能会抢占市场份额,致使OpenAI等公司落后。”他指出,这种向Gemini的转变可能会影响整个市场,引发甲骨文和微软等OpenAI合作伙伴的担忧。
在模型的质量方面,许多业内人士称Gemini 3符合甚至超出预期。例如,沃顿商学院教授伊桑·莫利克(Ethan Mollick)指出:“Gemini 3是一款非常优秀、速度极快的模型,并展现出了从聊天机器人到agent(助理)的转变......如果我们将‘博士级智力’定义为能像合格的研究生那样工作,那么它确实做到了。”
不过,也有业内人士指出,Gemini 3的事实准确率仍有待提升。例如,AI初创公司Oumi的联合创始人Manos Koukoumidis指出:“如果人们指望谷歌把他们从‘蓝色超链接’的海洋中解救出来并替他们完成工作,目前的水平还远远不够。”
18日当天,谷歌(Nasdaq:GOOGL)跌0.26%收于每股284.28美元,总市值3.43万亿美元,盘后涨超1.6%。
谷歌母公司Alphabet发布的截至9月30日的2025年第三季度财报显示,谷歌第三季度实现营收1023.46亿美元,同比增长16%;非美国通用会计准则下(Non-GAAP)净利润为349.79亿美元,同比增长33%。同时,谷歌年内第二次上调预期,预计2025年的资本支出将在910亿美元至930亿美元之间。
(文章来源:澎湃新闻)
原标题:远超外界预期?谷歌最新大模型Gemini 3横扫各大榜单,马斯克、奥特曼接连点赞
郑重声明:信查查发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。



