您现在的位置是：首页 > 人工智能 >

中国第一，阿里146篇论文入选AI顶会NeurIPS 2025

2025-12-05 14:14:45作者：来源：中国信息化周报

摘要　12月5日消息，人工智能领域顶级国际会议NeurIPS 2025在美国圣迭戈召开，本届会议，阿里巴巴共146篇论文入选，是论文收录数量最多的中国公司。其中，阿里千问在门控注意力机制上的成果被评为最佳论文，为唯一获奖的中国公司。...

　　12月5日消息，人工智能领域顶级国际会议NeurIPS 2025在美国圣迭戈召开，本届会议，阿里巴巴共146篇论文入选，是论文收录数量最多的中国公司。其中，阿里千问在门控注意力机制上的成果被评为最佳论文，为唯一获奖的中国公司。

　　NeurIPS是人工智能领域影响力最大的顶会之一，该会议诞生了Transformer、AlexNet等里程碑式研究成果。今年，谷歌、微软、OpenAI、阿里巴巴及麻省理工学院等全球顶尖科技公司和机构共有2万多篇论文投稿，仅有约25%的论文被接收。统计数据显示，谷歌、微软、Meta和阿里巴巴是论文数量前四的科技公司。

　　据介绍，此次阿里入选的146篇论文全面覆盖了模型训练框架、数据集和模型基础研究和模型推理优化等领域，展现了阿里在全栈AI体系的创新成果。

　　在模型基础研究方面，阿里千问团队发表的《Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free》论文，首次清晰揭秘了门控注意力背后的作用原理，并全面展示使用该方案的最佳方式，为业界突破当下大模型训练瓶颈提供了新的理论基础，该论文已被评为本届会议的最佳论文。NeurIPS评审委员会指出：“这项工作将被广泛应用，并极大推动AI研究人员对大语言模型中注意力机制的理解。”

　　在训练框架层，阿里在《Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models》论文中，提出了全新的Data-Juicer 2.0数据处理系统，该系统内置100多种数据处理算子，覆盖文本、图像、视频和音频等多种模态，全面支持数据分析、合成、标注以及基础模型后训练等关键任务，有效解决多模态数据所特有的复杂性问题，目前该成果已应用于阿里云人工智能平台PAI。

　　在推理效率方面，阿里云和浙江大学合作的《Controlling Thinking Speed in Reasoning Models》论文中提出全新的推理优化方案：通过动态调节大模型的思维速度，让模型更接近人类智能。实验结果显示，该方法在GSM8K、MATH、AIME等评测集上取得平均1.3%的准确率提升，同时减少8.6%的Token使用，实现了推理准确性与效率之间的平衡。

　　据悉，目前阿里千问已开源300多款模型，涵盖全模态、全尺寸，全球下载量突破7亿次，衍生模型超过18万个，位居全球第一。在Gartner发布的GenAI云基础设施、GenAI工程、GenAI模型以及AI知识管理应用四大维度的新兴市场象限报告中，阿里云均位于新兴领导者象限，是入选全部四项新兴领导者象限的唯一亚太厂商。

(本文不涉密)
责任编辑：路沙

上一篇：世界模型，下一个技术奇点？

下一篇：众论AI+XR眼镜：如何让消费者“买得起、用得好”