中国AI研究新突破 阿里千问斩获顶级AI会议最佳论文奖
2025-11-28 12:33:44 来源:上海证券报·中国证券网
上证报中国证券网讯(记者杨翔菲 温婷)11月28日,记者获悉,日前,人工智能领域顶级会议NeurIPS 2025公布了论文奖。阿里通义千问团队的最新研究成果从全球2万多篇投稿论文中脱颖而出,荣获最佳论文,是唯一获该奖的中国团队。
该论文首次揭示了注意力门控机制对大模型性能及训练的影响。业内人士普遍觉得,此研究是突破当下大模型训练瓶颈的关键一步,会有力推动AI大模型技术发展。
NeurIPS是人工智能领域极具影响力的顶级会议之一,诞生过Transformer、AlexNet等里程碑式研究成果。今年,谷歌、微软、OpenAI、阿里巴巴及麻省理工学院等全球顶尖科技公司和机构共投稿2万多篇论文,仅约25%的论文被接收,最佳论文仅4篇,代表了当前全球人工智能领域最具价值和影响力的研究。
门控机制被视作模型的“智能阀门”,能助模型过滤无效信息并提升性能。近年,AlphaFold2、Forgetting Transformer等学术界和工业界模型开始尝试将门控与注意力机制结合,但业界尚未解开其在注意力中发挥作用的内在缘由,也缺乏大规模实践经验。
此次,通义千问研究团队在1.7B稠密模型与15B混合专家模型上进行了数十组实验,单组实验训练最多超3.5万亿tokens,首次清晰揭示了门控注意力背后的作用原理,并全面展示使用该方案的最佳方式。目前,该研究成果已应用于Qwen3-Next模型,显著提升了模型的性能与鲁棒性,相关技术方案、实验模型及产品级模型均已开源。NeurIPS评审委员会指出:“这项工作将被广泛应用,极大推动AI研究人员对大语言模型中注意力机制的理解。”
通义千问团队称:“对门控注意力机制的深入理解,不仅为大语言模型架构设计提供了新思路,也为构建更稳定、高效、可控的大模型奠定了基础。”
(文章来源:上海证券报·中国证券网)
(文章来源:上海证券报·中国证券网)
原标题:中国AI研究新突破 阿里千问斩获顶级AI会议最佳论文奖
郑重声明:信查查发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。



