您现在的位置是：首页 > IT基础架构 > 计算存储 >

超节点成为AI算力瓶颈突破的新引擎

2025-11-17 12:34:41作者：路沙来源：中国信息化周报

摘要随着人工智能技术的飞速发展，尤其是大模型训练和推理对算力的海量需求，以及对高效、低延迟通信和大规模并行计算能力的迫切要求，推动了超节点产品的市场需求。同时，数据中心对高密度、高性能计算架构的追求，以及对能效比和成本效益的考量，也促使超节点产品成为行业关注的焦点。...

随着人工智能技术的飞速发展，尤其是大模型训练和推理对算力的海量需求，以及对高效、低延迟通信和大规模并行计算能力的迫切要求，推动了超节点产品的市场需求。同时，数据中心对高密度、高性能计算架构的追求，以及对能效比和成本效益的考量，也促使超节点产品成为行业关注的焦点。

近日，在2025世界互联网大会乌镇峰会期间，中科曙光发布了全球首个单机柜级640卡超节点scaleX640。据介绍，scaleX640基于“AI计算开放架构”理念设计，通过系统工程创新，实现了算、存、网、电、冷的一体化紧耦合系统创新。同时，scaleX640采用“一拖二”高密架构设计，还实现了单机柜640卡超高速总线互连，构建起大规模、高带宽、低时延的超节点通信域。

scaleX640吸引了众多关注

中科曙光高级副总裁李斌表示，面向未来更大参数规模的模型，集群化算力系统是核心支撑。因为当前行业主流的技术路径是采用“柜内铜电互联+柜间光传输”的模式，在此技术框架下，机柜内部集成度直接决定核心竞争力。集成度越高，越能突破现有互联技术的瓶颈，形成显著竞争优势。

系统级创新成为共同选择

“超节点”产品，通过系统级创新，不仅能够从整体架构层面优化算力资源的配置与协同，推动硬件与软件的深度融合，打破传统架构的瓶颈，实现更高的计算效率、更低的能耗以及更灵活的资源调度，还可以更好地满足大规模并行计算和复杂任务处理的需求，推动超节点产品在高性能计算领域的广泛应用。

中科曙光高级副总裁李斌

李斌表示，尽管国内外厂商在单点芯片层面存在差距，但包括中科曙光在内的国内企业正通过系统化工程创新，在供电效率、柜体密度、互联扩展等方面形成差异化优势，实现了部分领域的弥补与反超。

呈现多技术路线并存态势

面对纷繁复杂的超节点产品，各家企业的侧重点会有哪些不同？对此，中科曙光总裁助理、智能计算产品事业部总经理杜夏威表示，不同类型厂商的技术侧重点存在显著差异，例如，芯片厂商可能更聚焦单一芯片的性能突破，网络厂商则侧重网络扩展能力的强化。而对于算力系统而言，过往在万卡级别场景中的调试经验与技术储备至关重要——这不仅包括硬件层面的产品化打磨，还涵盖软件适配、业务场景实测及应用调优的全流程积累。这些底层功底与实践积累，最终都会转化为产品的实际使用价值。

与此同时用户最终的选择也会受多重因素的影响。“从用户决策视角来看，首要考量是应用的可行性与落地效果，能否顺畅运行是基础前提，而完善的软件生态是实现这一目标的关键支撑。在此基础上，用户会进一步评估业务快速部署后的实际表现与性能水平，这一过程涉及大量软硬件耦合的适配工作。”李斌如是说。

对于未来超节点技术的演进方向，李斌表示数据中心基础设施已发生显著变化，机柜功率从几千瓦大幅跃升，因此，未来人工智能与智能体的发展，对算力中心建设与服务模式产生颠覆性影响。而在这一过程中，国内超节点市场将呈现多技术路线共存态势，良性竞争与合作将推动行业标准与生态完善。

开放生态推进协同创新

据了解，2025年9月，中科曙光协同AI芯片、整机、大模型等20多家AI产业链上下游企业，共同发布了国内首个AI计算开放架构，并携手伙伴企业开放多项技术能力，并宣布依托国家先进计算产业创新中心，启动“AI计算开放架构联合实验室”建设。

李斌表示，该开放架构的核心优势体现在两大维度：一是系统集成创新，围绕大模型算力需求与核心芯片特性，优化设计数据传输通路，实现计算、传输与缓存的高效协同，同时深化计算、冷却、供电系统的高度耦合，进一步提升整体运行效率。二是秉持开放合作与能力共享原则，在开放架构基础上与合作伙伴构建系列合作计划，涵盖芯片互联技术、柜体供电冷却方案、系统硬件架构设计等关键领域。

不难看出，超节点技术的持续演进离不开开放生态的支撑，其核心逻辑在于：超节点作为大模型等场景的核心算力载体，需通过开放架构打破软硬件耦合壁垒，既依托系统级创新实现计算、传输、冷却等模块的高效协同，又需联合芯片、网络、软件等产业链伙伴，共享技术标准、共研关键方案、共建适配体系，才能破解规模扩展、效率提升、成本优化等核心难题，最终实现技术落地与产业价值的双向赋能。

(本文不涉密)
责任编辑：路沙

上一篇：施耐德电气：以“电力+冷却”双创新引领智算产业高质量发展

下一篇：青云科技AI Infra 3.0以渐进式创新搭建衔接历史与未来的坚实桥梁