您现在的位置是:首页 > 人工智能 >
中国第一,阿里146篇论文入选AI顶会NeurIPS 2025
2025-12-05 14:14:45作者:来源:中国信息化周报
摘要 12月5日消息,人工智能领域顶级国际会议NeurIPS 2025在美国圣迭戈召开,本届会议,阿里巴巴共146篇论文入选,是论文收录数量最多的中国公司。其中,阿里千问在门控注意力机制上的成果被评为最佳论文,为唯一获奖的中国公司。...

NeurIPS是人工智能领域影响力最大的顶会之一,该会议诞生了Transformer、AlexNet等里程碑式研究成果。今年,谷歌、微软、OpenAI、阿里巴巴及麻省理工学院等全球顶尖科技公司和机构共有2万多篇论文投稿,仅有约25%的论文被接收。统计数据显示,谷歌、微软、Meta和阿里巴巴是论文数量前四的科技公司。
据介绍,此次阿里入选的146篇论文全面覆盖了模型训练框架、数据集和模型基础研究和模型推理优化等领域,展现了阿里在全栈AI体系的创新成果。
在模型基础研究方面,阿里千问团队发表的《Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free》论文,首次清晰揭秘了门控注意力背后的作用原理,并全面展示使用该方案的最佳方式,为业界突破当下大模型训练瓶颈提供了新的理论基础,该论文已被评为本届会议的最佳论文。NeurIPS评审委员会指出:“这项工作将被广泛应用,并极大推动AI研究人员对大语言模型中注意力机制的理解。”

在训练框架层,阿里在《Data-Juicer 2.0: Cloud-Scale Adaptive Data Processing for and with Foundation Models》论文中,提出了全新的Data-Juicer 2.0数据处理系统,该系统内置100多种数据处理算子,覆盖文本、图像、视频和音频等多种模态,全面支持数据分析、合成、标注以及基础模型后训练等关键任务,有效解决多模态数据所特有的复杂性问题,目前该成果已应用于阿里云人工智能平台PAI。
在推理效率方面,阿里云和浙江大学合作的《Controlling Thinking Speed in Reasoning Models》论文中提出全新的推理优化方案:通过动态调节大模型的思维速度,让模型更接近人类智能。实验结果显示,该方法在GSM8K、MATH、AIME等评测集上取得平均1.3%的准确率提升,同时减少8.6%的Token使用,实现了推理准确性与效率之间的平衡。
据悉,目前阿里千问已开源300多款模型,涵盖全模态、全尺寸,全球下载量突破7亿次,衍生模型超过18万个,位居全球第一。在Gartner发布的GenAI云基础设施、GenAI工程、GenAI模型以及AI知识管理应用四大维度的新兴市场象限报告中,阿里云均位于新兴领导者象限,是入选全部四项新兴领导者象限的唯一亚太厂商。
(本文不涉密)
责任编辑:路沙





