您现在的位置是：首页 > 特别推荐 >

斯坦福权威报告：阿里AI贡献全球第三、中国第一

2026-04-16 17:32:26作者：来源：中国信息化周报

摘要4月16日消息，斯坦福大学人工智能研究所发布了最新一期《2026年人工智能指数报告》，阿里巴巴位列2025年全球顶级模型贡献榜第三名，同时也是入选重要模型最多的中国科技公司。该报告指出，当前中美顶级大模型差距“实质性消除”，头部模型间表现相当，呈并跑态势。报告显示，在前20的AI机构中，中国11家超过美国位居首位。...

　　4月16日消息，斯坦福大学人工智能研究所发布了最新一期《2026年人工智能指数报告》，阿里巴巴位列2025年全球顶级模型贡献榜第三名，同时也是入选重要模型最多的中国科技公司。该报告指出，当前中美顶级大模型差距“实质性消除”，头部模型间表现相当，呈并跑态势。报告显示，在前20的AI机构中，中国11家超过美国位居首位。

　　据了解，《人工智能指数报告》由斯坦福大学人工智能研究所于2017年推出，每年联合全球学术、产业与政策领域专家对当前人工智能行业的技术进步、经济影响和社会影响提供严谨客观的分析，是业界公认的AI领域最权威的年度报告之一。

　　报告指出，目前中美仍是全球AI最具影响力的两大国家，双方差距已“实质性消除”(effectively closed)，呈现并跑态势。2025年，美国发布了50个重要模型，中国发布了30个。其中仅阿里巴巴就贡献了11个，在国产模型中占比接近40%，仅次于Open AI 的19个和Google的12个，连续第二年位居全球第三。在Arena排行榜上，美国的Anthropic、xAI、Google、OpenAI和中国的阿里巴巴、DeepSeek等六家企业共同构成顶级梯队，彼此间竞争焦灼，且竞争焦点逐渐从性能比拼转向成本、可靠性与真实世界实用性。

　　斯坦福报告还显示，在多项细分能力评测中，阿里千问系列均有亮眼表现。比如，在聚焦真实工作流中工具调用与智能体交互能力的τ-bench基准测试中，Qwen3.5以68.4%的任务成功率，位列全球第三;在体现小语种能力的HELM阿拉伯语测试中，Qwen3以0.79的平均得分(Mean Score)位居中国模型首位，也是最懂阿拉伯语的大模型之一;在考察多学科知识理解与推理能力的MMLU-Pro中，Qwen3.5以87.8%的准确率，媲美Gemini 3.1 Pro、Claude Opus 4.6等国外顶尖模型。

　　此外，报告中还特别指出，自2023年以来，全球开源AI生态呈爆发式增长。数据显示，GitHub平台上的开源AI项目已突破560万个，Hugging Face社区的模型上传量在两年内增长到3倍。以阿里巴巴、DeepSeek为代表的中国企业在其中表现突出，截至目前，阿里千问大模型共开源400多款，全球衍生模型数量超20万，全球下载量破10亿，是全球第一的开源模型家族。据了解，千问3.6系列也即将推出新的开源模型。

(本文不涉密)
责任编辑：路沙

上一篇：Agentic Engineering：以 AI 智能体重构产品开发的新工程范式

下一篇：阿里开源千问3.6系列中等尺寸模型，性能超越谷歌同类模型