您现在的位置是:首页 > IT基础架构 > 计算存储 >
全栈优化铸就硬核实力 中科曙光新一代通用高性能计算平台助力国产算力国际领跑
2026-06-16 17:32:33作者:路沙来源:中国信息化周报
摘要近日,中科曙光发布了新一代通用高性能计算平台。据悉,新一代通用高性能计算平台是以128核512线程通用高性能处理器为核心,依托算、存、传三级协同能力,打造的适配科学与工程计算场景的全新算力平台。 ...
AI时代,尽管GPU凭借强大的并行算力能力,备受行业推崇,但依靠强悍的复杂逻辑运算能力、成熟无成本迁移的完整生态,CPU在科学工程、精密仿真、基础科研等诸多专属场景中依旧具备不可替代的关键作用,二者差异化互补的算力格局正加速形成。
近日,中科曙光发布了新一代通用高性能计算平台。据悉,新一代通用高性能计算平台是以128核512线程通用高性能处理器为核心,依托算、存、传三级协同能力,打造的适配科学与工程计算场景的全新算力平台。
事实上,这一平台就采用了CPU计算架构。对此,中科曙光高端计算总工程师李建军解释说,平台仍聚焦CPU计算架构原因主要在于:一,CPU可兼容浮点运算、逻辑判断等全类型计算任务,是支撑多领域复杂算法的通用算力底座;二,CPU配备高精度浮点运算单元,能够充分保障科学与工程计算的运算精度;三,现阶段主流科学与工程计算类专业软件,运行均高度依赖CPU生态。
实现计算平台全栈优化
据了解,此次发布的新一代通用高性能计算平台从软件、计算、传输、存储四大维度实现了全栈优化:一是软件栈配套适配CPU的专业数学库、编译器与通信库,充分释放处理器硬件性能;二是计算层搭载两项核心技术。利用BurstBuffer技术,在大型集群运算过程中,可将数据先行缓存至计算节点CPU下属SSD单元,大幅提升数据读写效率;依托SocketDirect技术,在集群通信时各CPU可直接连接网卡完成跨节点数据交互,无需经过CPU之间的数据中转,有效提升集群网络通信性能;三是传输层采用scaleFabric原生RDMA网络技术,带宽可达400G,与国际主流NDR标准持平,具备高带宽、低延迟的特性,适配科学与工程计算集群的搭建需求;四是存储层强化并行能力。在磁盘数量不变的前提下,提升存储节点内部并行度,实现单CPU挂载多块硬盘的效果,能够有效打破传统双路服务器的架构局限,显著提升I/O并行处理能力与整体性能。
除此之外,该平台还可直接兼容主流软件生态,行业存量软件可直接在本平台运行,无需额外适配。中科曙光的核心工作,一方面,针对客户全新自研的科学与工程计算软件开展专项适配;另一方面,依托全栈优化技术,充分释放国产芯片硬件性能,为用户提供更优质的运算体验。
李建军表示,该平台并非专用超算设备,而是具备普及应用能力的计算平台。针对传统算力集群存在的内存瓶颈、散热、供电、数据传输等问题,中科曙光摒弃单点技术升级思路,采用从底层芯片到上层软件的全栈系统优化方案,通过优化节点数据传输、升级网络通信技术、提升存储并行能力等系统化手段,能够有效破解内存墙、传输墙等行业难题。
在整体性能层面,相较于当代平台,新一代通用高性能计算平台基准性能提升近三倍,产品基准性能、实际应用性能均对标国际主流高端产品,并且部分指标已实现超越。“该成果标志着国内在高性能计算领域实现关键技术突破,国产设备综合能力已达到国际一流水平。”李建军如是说。
兼顾多种散热形态 灵活匹配多业务部署环境
这一计算平台在散热架构上做了多形态节点布局,整体设计包含风冷、冷板液冷、浸没式液冷三类差异化计算节点。
从技术应用的角度来看,风冷节点运维简便、投入成本低,日常检修、设备更换门槛低,通用性极强;冷板液冷依托板式换热结构,散热效率优于风冷,能够兼顾散热性能与改造难度,平衡建设成本与运行功耗;浸没式液冷散热能力最强,可承载超高密度算力负载,适配大型超算中心、大规模AI训练集群等高发热核心场景,能大幅降低PUE值,实现高效节能运行。
对此,李建军进一步解释说,风冷计算节点沿用互联网、运营商通用技术标准,稳定性出众且网络扩展能力优异;冷板式计算节点可适配标准机柜与客户存量设备,单柜搭载32个节点、64颗处理器,双节点算力超1P,PUE低至1.08,并且具备高密度、标准化、可整柜快速交付的特点;浸没式计算柜单柜最高支持80000+CPU核心部署,硬件密度行业领先,PUE降至1.04,节能性更为突出。同时,密闭运行环境大幅降低了外界环境干扰,使得设备可靠性更强,运维监控更加便捷。
平台通过兼顾多种散热形态,并非简单的技术分级,而是形成分层互补的完整体系,既能满足不同客户的机房条件、算力规模、预算与运维能力需求,也标志着算力设施从追求基础可用,转向高效、低碳、高可靠的全新发展阶段,助力算力产业实现算电协同与绿色化转型。
聚焦场景规模化落地 完成从可用到好用跨越
平台的发布绝非单纯完成算力硬件、计算架构的技术落地,其核心价值在于真实业务场景的规模化落地。身处其中,平台只是承载算力、数据与模型的基础设施载体,只有深度适配工业仿真、气象预测、生物医药研发等行业实际需求,针对性解决企业算力成本高、调度复杂、业务适配难等痛点,把抽象算力转化为可落地的行业解决方案、可量化的业务增效成果,打通从底层算力供给到产业价值产出的完整闭环,才能真正释放计算平台的生产力价值。
李建军表示,该平台作为通用计算平台,可广泛应用于六大行业场景:地球科学领域,支撑气象预报、气候模拟等工作;工业设计制造领域,服务大飞机、船舶、汽车等产品的仿真研发;能源勘探领域,应用于油气勘探、爆炸模拟分析;物理化学材料领域,助力新材料筛选研发;生命科学领域,开展蛋白质分析、新药研发等工作;集成电路领域,完成电磁仿真任务等。
从具体应用表现上来看,在气象领域,平台整体性能对标国际主流平台,可将气象模拟分辨率由3公里提升至1公里,一小时内即可完成全国范围36小时气象预报;在工业仿真领域,实测性能比肩国内外主流产品,依托成熟CPU生态,现有专业软件无需迁移即可直接运行;在生命科学与材料领域,平台支持AVX512指令集与4线程运行模式,大幅提升高通量计算、材料仿真类任务的运行效率。
李建军表示,中科曙光长期深耕高性能计算领域,始终助力各行业客户加速科技创新,持续推动国内计算产业国产化进程。此次发布新一代通用高性能计算平台,旨在让国产高性能计算设备实现“可用”向“好用”升级,并依托系统、软件、算存传一体化技术优化,全面提升综合性能。
(本文不涉密)
责任编辑:路沙
近日,中科曙光发布了新一代通用高性能计算平台。据悉,新一代通用高性能计算平台是以128核512线程通用高性能处理器为核心,依托算、存、传三级协同能力,打造的适配科学与工程计算场景的全新算力平台。
事实上,这一平台就采用了CPU计算架构。对此,中科曙光高端计算总工程师李建军解释说,平台仍聚焦CPU计算架构原因主要在于:一,CPU可兼容浮点运算、逻辑判断等全类型计算任务,是支撑多领域复杂算法的通用算力底座;二,CPU配备高精度浮点运算单元,能够充分保障科学与工程计算的运算精度;三,现阶段主流科学与工程计算类专业软件,运行均高度依赖CPU生态。
实现计算平台全栈优化
据了解,此次发布的新一代通用高性能计算平台从软件、计算、传输、存储四大维度实现了全栈优化:一是软件栈配套适配CPU的专业数学库、编译器与通信库,充分释放处理器硬件性能;二是计算层搭载两项核心技术。利用BurstBuffer技术,在大型集群运算过程中,可将数据先行缓存至计算节点CPU下属SSD单元,大幅提升数据读写效率;依托SocketDirect技术,在集群通信时各CPU可直接连接网卡完成跨节点数据交互,无需经过CPU之间的数据中转,有效提升集群网络通信性能;三是传输层采用scaleFabric原生RDMA网络技术,带宽可达400G,与国际主流NDR标准持平,具备高带宽、低延迟的特性,适配科学与工程计算集群的搭建需求;四是存储层强化并行能力。在磁盘数量不变的前提下,提升存储节点内部并行度,实现单CPU挂载多块硬盘的效果,能够有效打破传统双路服务器的架构局限,显著提升I/O并行处理能力与整体性能。
除此之外,该平台还可直接兼容主流软件生态,行业存量软件可直接在本平台运行,无需额外适配。中科曙光的核心工作,一方面,针对客户全新自研的科学与工程计算软件开展专项适配;另一方面,依托全栈优化技术,充分释放国产芯片硬件性能,为用户提供更优质的运算体验。
李建军表示,该平台并非专用超算设备,而是具备普及应用能力的计算平台。针对传统算力集群存在的内存瓶颈、散热、供电、数据传输等问题,中科曙光摒弃单点技术升级思路,采用从底层芯片到上层软件的全栈系统优化方案,通过优化节点数据传输、升级网络通信技术、提升存储并行能力等系统化手段,能够有效破解内存墙、传输墙等行业难题。
在整体性能层面,相较于当代平台,新一代通用高性能计算平台基准性能提升近三倍,产品基准性能、实际应用性能均对标国际主流高端产品,并且部分指标已实现超越。“该成果标志着国内在高性能计算领域实现关键技术突破,国产设备综合能力已达到国际一流水平。”李建军如是说。
兼顾多种散热形态 灵活匹配多业务部署环境
这一计算平台在散热架构上做了多形态节点布局,整体设计包含风冷、冷板液冷、浸没式液冷三类差异化计算节点。
从技术应用的角度来看,风冷节点运维简便、投入成本低,日常检修、设备更换门槛低,通用性极强;冷板液冷依托板式换热结构,散热效率优于风冷,能够兼顾散热性能与改造难度,平衡建设成本与运行功耗;浸没式液冷散热能力最强,可承载超高密度算力负载,适配大型超算中心、大规模AI训练集群等高发热核心场景,能大幅降低PUE值,实现高效节能运行。
对此,李建军进一步解释说,风冷计算节点沿用互联网、运营商通用技术标准,稳定性出众且网络扩展能力优异;冷板式计算节点可适配标准机柜与客户存量设备,单柜搭载32个节点、64颗处理器,双节点算力超1P,PUE低至1.08,并且具备高密度、标准化、可整柜快速交付的特点;浸没式计算柜单柜最高支持80000+CPU核心部署,硬件密度行业领先,PUE降至1.04,节能性更为突出。同时,密闭运行环境大幅降低了外界环境干扰,使得设备可靠性更强,运维监控更加便捷。
平台通过兼顾多种散热形态,并非简单的技术分级,而是形成分层互补的完整体系,既能满足不同客户的机房条件、算力规模、预算与运维能力需求,也标志着算力设施从追求基础可用,转向高效、低碳、高可靠的全新发展阶段,助力算力产业实现算电协同与绿色化转型。
聚焦场景规模化落地 完成从可用到好用跨越
平台的发布绝非单纯完成算力硬件、计算架构的技术落地,其核心价值在于真实业务场景的规模化落地。身处其中,平台只是承载算力、数据与模型的基础设施载体,只有深度适配工业仿真、气象预测、生物医药研发等行业实际需求,针对性解决企业算力成本高、调度复杂、业务适配难等痛点,把抽象算力转化为可落地的行业解决方案、可量化的业务增效成果,打通从底层算力供给到产业价值产出的完整闭环,才能真正释放计算平台的生产力价值。
李建军表示,该平台作为通用计算平台,可广泛应用于六大行业场景:地球科学领域,支撑气象预报、气候模拟等工作;工业设计制造领域,服务大飞机、船舶、汽车等产品的仿真研发;能源勘探领域,应用于油气勘探、爆炸模拟分析;物理化学材料领域,助力新材料筛选研发;生命科学领域,开展蛋白质分析、新药研发等工作;集成电路领域,完成电磁仿真任务等。
从具体应用表现上来看,在气象领域,平台整体性能对标国际主流平台,可将气象模拟分辨率由3公里提升至1公里,一小时内即可完成全国范围36小时气象预报;在工业仿真领域,实测性能比肩国内外主流产品,依托成熟CPU生态,现有专业软件无需迁移即可直接运行;在生命科学与材料领域,平台支持AVX512指令集与4线程运行模式,大幅提升高通量计算、材料仿真类任务的运行效率。
李建军表示,中科曙光长期深耕高性能计算领域,始终助力各行业客户加速科技创新,持续推动国内计算产业国产化进程。此次发布新一代通用高性能计算平台,旨在让国产高性能计算设备实现“可用”向“好用”升级,并依托系统、软件、算存传一体化技术优化,全面提升综合性能。
(本文不涉密)
责任编辑:路沙
下一篇:最后一页





