您现在的位置是:首页 > 特别推荐 >

斯坦福权威报告:阿里AI贡献全球第三、中国第一

2026-04-16 17:32:26作者:来源:中国信息化周报

摘要4月16日消息,斯坦福大学人工智能研究所发布了最新一期《2026年人工智能指数报告》,阿里巴巴位列2025年全球顶级模型贡献榜第三名,同时也是入选重要模型最多的中国科技公司。该报告指出,当前中美顶级大模型差距“实质性消除”,头部模型间表现相当,呈并跑态势。报告显示,在前20的AI机构中,中国11家超过美国位居首位。...

  4月16日消息,斯坦福大学人工智能研究所发布了最新一期《2026年人工智能指数报告》,阿里巴巴位列2025年全球顶级模型贡献榜第三名,同时也是入选重要模型最多的中国科技公司。该报告指出,当前中美顶级大模型差距“实质性消除”,头部模型间表现相当,呈并跑态势。报告显示,在前20的AI机构中,中国11家超过美国位居首位。

  据了解,《人工智能指数报告》由斯坦福大学人工智能研究所于2017年推出,每年联合全球学术、产业与政策领域专家对当前人工智能行业的技术进步、经济影响和社会影响提供严谨客观的分析,是业界公认的AI领域最权威的年度报告之一。

  报告指出,目前中美仍是全球AI最具影响力的两大国家,双方差距已“实质性消除”(effectively closed),呈现并跑态势。2025年,美国发布了50个重要模型,中国发布了30个。其中仅阿里巴巴就贡献了11个,在国产模型中占比接近40%,仅次于Open AI 的19个和Google的12个,连续第二年位居全球第三。在Arena排行榜上,美国的Anthropic、xAI、Google、OpenAI和中国的阿里巴巴、DeepSeek等六家企业共同构成顶级梯队,彼此间竞争焦灼,且竞争焦点逐渐从性能比拼转向成本、可靠性与真实世界实用性。

  斯坦福报告还显示,在多项细分能力评测中,阿里千问系列均有亮眼表现。比如,在聚焦真实工作流中工具调用与智能体交互能力的τ-bench基准测试中,Qwen3.5以68.4%的任务成功率,位列全球第三;在体现小语种能力的HELM阿拉伯语测试中,Qwen3以0.79的平均得分(Mean Score)位居中国模型首位,也是最懂阿拉伯语的大模型之一;在考察多学科知识理解与推理能力的MMLU-Pro中,Qwen3.5以87.8%的准确率,媲美Gemini 3.1 Pro、Claude Opus 4.6等国外顶尖模型。

  此外,报告中还特别指出,自2023年以来,全球开源AI生态呈爆发式增长。数据显示,GitHub平台上的开源AI项目已突破560万个,Hugging Face社区的模型上传量在两年内增长到3倍。以阿里巴巴、DeepSeek为代表的中国企业在其中表现突出,截至目前,阿里千问大模型共开源400多款,全球衍生模型数量超20万,全球下载量破10亿,是全球第一的开源模型家族。据了解,千问3.6系列也即将推出新的开源模型。


(本文不涉密)
责任编辑:路沙

站点信息

  • 运营主体:中国信息化周报
  • 商务合作:赵瑞华 010-88559646
  • 微信公众号:扫描二维码,关注我们