您现在的位置是:首页 > IT基础架构 > 计算存储 >
超节点成为AI算力瓶颈突破的新引擎
2025-11-17 12:34:41作者:路沙来源:中国信息化周报
摘要随着人工智能技术的飞速发展,尤其是大模型训练和推理对算力的海量需求,以及对高效、低延迟通信和大规模并行计算能力的迫切要求,推动了超节点产品的市场需求。同时,数据中心对高密度、高性能计算架构的追求,以及对能效比和成本效益的考量,也促使超节点产品成为行业关注的焦点。...
随着人工智能技术的飞速发展,尤其是大模型训练和推理对算力的海量需求,以及对高效、低延迟通信和大规模并行计算能力的迫切要求,推动了超节点产品的市场需求。同时,数据中心对高密度、高性能计算架构的追求,以及对能效比和成本效益的考量,也促使超节点产品成为行业关注的焦点。
近日,在2025世界互联网大会乌镇峰会期间,中科曙光发布了全球首个单机柜级640卡超节点scaleX640。据介绍,scaleX640基于“AI计算开放架构”理念设计,通过系统工程创新,实现了算、存、网、电、冷的一体化紧耦合系统创新。同时,scaleX640采用“一拖二”高密架构设计,还实现了单机柜640卡超高速总线互连,构建起大规模、高带宽、低时延的超节点通信域。
系统级创新成为共同选择
“超节点”产品,通过系统级创新,不仅能够从整体架构层面优化算力资源的配置与协同,推动硬件与软件的深度融合,打破传统架构的瓶颈,实现更高的计算效率、更低的能耗以及更灵活的资源调度,还可以更好地满足大规模并行计算和复杂任务处理的需求,推动超节点产品在高性能计算领域的广泛应用。
呈现多技术路线并存态势
面对纷繁复杂的超节点产品,各家企业的侧重点会有哪些不同?对此,中科曙光总裁助理、智能计算产品事业部总经理杜夏威表示,不同类型厂商的技术侧重点存在显著差异,例如,芯片厂商可能更聚焦单一芯片的性能突破,网络厂商则侧重网络扩展能力的强化。而对于算力系统而言,过往在万卡级别场景中的调试经验与技术储备至关重要——这不仅包括硬件层面的产品化打磨,还涵盖软件适配、业务场景实测及应用调优的全流程积累。这些底层功底与实践积累,最终都会转化为产品的实际使用价值。
与此同时用户最终的选择也会受多重因素的影响。“从用户决策视角来看,首要考量是应用的可行性与落地效果,能否顺畅运行是基础前提,而完善的软件生态是实现这一目标的关键支撑。在此基础上,用户会进一步评估业务快速部署后的实际表现与性能水平,这一过程涉及大量软硬件耦合的适配工作。”李斌如是说。
对于未来超节点技术的演进方向,李斌表示数据中心基础设施已发生显著变化,机柜功率从几千瓦大幅跃升,因此,未来人工智能与智能体的发展,对算力中心建设与服务模式产生颠覆性影响。而在这一过程中,国内超节点市场将呈现多技术路线共存态势,良性竞争与合作将推动行业标准与生态完善。
开放生态推进协同创新
据了解,2025年9月,中科曙光协同AI芯片、整机、大模型等20多家AI产业链上下游企业,共同发布了国内首个AI计算开放架构,并携手伙伴企业开放多项技术能力,并宣布依托国家先进计算产业创新中心,启动“AI计算开放架构联合实验室”建设。
李斌表示,该开放架构的核心优势体现在两大维度:一是系统集成创新,围绕大模型算力需求与核心芯片特性,优化设计数据传输通路,实现计算、传输与缓存的高效协同,同时深化计算、冷却、供电系统的高度耦合,进一步提升整体运行效率。二是秉持开放合作与能力共享原则,在开放架构基础上与合作伙伴构建系列合作计划,涵盖芯片互联技术、柜体供电冷却方案、系统硬件架构设计等关键领域。
不难看出,超节点技术的持续演进离不开开放生态的支撑,其核心逻辑在于:超节点作为大模型等场景的核心算力载体,需通过开放架构打破软硬件耦合壁垒,既依托系统级创新实现计算、传输、冷却等模块的高效协同,又需联合芯片、网络、软件等产业链伙伴,共享技术标准、共研关键方案、共建适配体系,才能破解规模扩展、效率提升、成本优化等核心难题,最终实现技术落地与产业价值的双向赋能。
(本文不涉密)
责任编辑:路沙
近日,在2025世界互联网大会乌镇峰会期间,中科曙光发布了全球首个单机柜级640卡超节点scaleX640。据介绍,scaleX640基于“AI计算开放架构”理念设计,通过系统工程创新,实现了算、存、网、电、冷的一体化紧耦合系统创新。同时,scaleX640采用“一拖二”高密架构设计,还实现了单机柜640卡超高速总线互连,构建起大规模、高带宽、低时延的超节点通信域。

scaleX640吸引了众多关注
中科曙光高级副总裁李斌表示,面向未来更大参数规模的模型,集群化算力系统是核心支撑。因为当前行业主流的技术路径是采用“柜内铜电互联+柜间光传输”的模式,在此技术框架下,机柜内部集成度直接决定核心竞争力。集成度越高,越能突破现有互联技术的瓶颈,形成显著竞争优势。系统级创新成为共同选择
“超节点”产品,通过系统级创新,不仅能够从整体架构层面优化算力资源的配置与协同,推动硬件与软件的深度融合,打破传统架构的瓶颈,实现更高的计算效率、更低的能耗以及更灵活的资源调度,还可以更好地满足大规模并行计算和复杂任务处理的需求,推动超节点产品在高性能计算领域的广泛应用。

中科曙光高级副总裁 李斌
李斌表示,尽管国内外厂商在单点芯片层面存在差距,但包括中科曙光在内的国内企业正通过系统化工程创新,在供电效率、柜体密度、互联扩展等方面形成差异化优势,实现了部分领域的弥补与反超。呈现多技术路线并存态势
面对纷繁复杂的超节点产品,各家企业的侧重点会有哪些不同?对此,中科曙光总裁助理、智能计算产品事业部总经理杜夏威表示,不同类型厂商的技术侧重点存在显著差异,例如,芯片厂商可能更聚焦单一芯片的性能突破,网络厂商则侧重网络扩展能力的强化。而对于算力系统而言,过往在万卡级别场景中的调试经验与技术储备至关重要——这不仅包括硬件层面的产品化打磨,还涵盖软件适配、业务场景实测及应用调优的全流程积累。这些底层功底与实践积累,最终都会转化为产品的实际使用价值。
与此同时用户最终的选择也会受多重因素的影响。“从用户决策视角来看,首要考量是应用的可行性与落地效果,能否顺畅运行是基础前提,而完善的软件生态是实现这一目标的关键支撑。在此基础上,用户会进一步评估业务快速部署后的实际表现与性能水平,这一过程涉及大量软硬件耦合的适配工作。”李斌如是说。
对于未来超节点技术的演进方向,李斌表示数据中心基础设施已发生显著变化,机柜功率从几千瓦大幅跃升,因此,未来人工智能与智能体的发展,对算力中心建设与服务模式产生颠覆性影响。而在这一过程中,国内超节点市场将呈现多技术路线共存态势,良性竞争与合作将推动行业标准与生态完善。
开放生态推进协同创新
据了解,2025年9月,中科曙光协同AI芯片、整机、大模型等20多家AI产业链上下游企业,共同发布了国内首个AI计算开放架构,并携手伙伴企业开放多项技术能力,并宣布依托国家先进计算产业创新中心,启动“AI计算开放架构联合实验室”建设。
李斌表示,该开放架构的核心优势体现在两大维度:一是系统集成创新,围绕大模型算力需求与核心芯片特性,优化设计数据传输通路,实现计算、传输与缓存的高效协同,同时深化计算、冷却、供电系统的高度耦合,进一步提升整体运行效率。二是秉持开放合作与能力共享原则,在开放架构基础上与合作伙伴构建系列合作计划,涵盖芯片互联技术、柜体供电冷却方案、系统硬件架构设计等关键领域。
不难看出,超节点技术的持续演进离不开开放生态的支撑,其核心逻辑在于:超节点作为大模型等场景的核心算力载体,需通过开放架构打破软硬件耦合壁垒,既依托系统级创新实现计算、传输、冷却等模块的高效协同,又需联合芯片、网络、软件等产业链伙伴,共享技术标准、共研关键方案、共建适配体系,才能破解规模扩展、效率提升、成本优化等核心难题,最终实现技术落地与产业价值的双向赋能。
(本文不涉密)
责任编辑:路沙





