昆仑芯超节点产品推出，大模型训推任务性能跨越式提升-Ameya360 electronic components purchasing network

昆仑芯超节点产品推出，大模型训推任务性能跨越式提升

Release time：2025-04-27

author：AMEYA360

source：昆仑芯

reading：3186

　　开年后，随着DeepSeek席卷千行百业，昆仑芯率先适配、业内首家单机部署满血版展示卓越性能，并在互联网、科研、金融等领域实现规模部署，一系列进展引发广泛关注。刚刚落幕的Create2025百度AI开发者大会上，昆仑芯作为底层算力核心被高频提及，三万卡集群点亮振奋人心，昆仑芯超节点也在大会上正式发布。

　　自ChatGPT问世，大模型参数快速增长，单卡显存无法容纳越来越大的模型参数，大模型对AI算力系统的并行通信能力提出越来越高的要求;同时开源MoE模型在多专家并行过程中也需要更高的通信效率。DeepSeek-V3/R1加速产业落地，AI算力集群对系统可扩展能力的需求变得空前迫切。

　　基于对大模型演进趋势及算力需求的前瞻预测，昆仑芯团队率先布局、潜心研发，面向大规模算力场景推出超节点新品，为AI算力集群性能优化和效率提升提供一套全栈解决方案。

昆仑芯超节点产品推出，大模型训推任务性能跨越式提升

　　昆仑芯超节点渲染图

　　1.全互联通信带宽提升8倍，训推性能跨越式提升

　　通过硬件架构创新，昆仑芯超节点突破传统单机8卡产品形态，超高密度设计使得单柜可容纳32/64张昆仑芯AI加速卡。单柜内卡间实现全互联通信，带宽提升高达8倍，一个机柜的算力最高可达到传统形态下8台8卡服务器，实现对MoE大模型单节点训练性能5-10倍、单卡推理效率13倍的大幅提升。

　　2.整柜功率可支持到120kW，大幅降低PUE

　　在能耗和散热方面，昆仑芯积极响应节能降耗政策，采用高效的冷板式液冷方式进行系统散热，整柜功率可支持到120kW，大幅降低数据中心的PUE(Power Usage Effectiveness，数据中心消耗的所有能源与IT负载消耗的能源的比值)。不仅如此，昆仑芯超节点支持液冷系统的漏液检测，可及时针对液冷故障进行预警、告警、修复等，最大化提高整机柜系统无间断稳定运行效率。

　　3.机柜间IB/RoCE通信，高带宽、低延迟

　　当前，各级政府、众多行业和头部企业集中发力，正在加快建设一批超大规模智算中心。针对集群拓展需求，昆仑芯超节点机柜间支持IB/RoCE通信，可实现跨柜高带宽、低延迟的数据传输，支持万卡以上规模的智算集群构建。

　　4.自研XPU Link，兼容主流scale-up通信标准

　　昆仑芯自研互联通信协议XPU Link，秉承一贯的“共生共赢”发展理念，昆仑芯XPU Link兼容scale-up通信标准OISA，与上下游合作伙伴共建超节点行业生态，携手推动国产AI算力在超节点集群中的规模部署和产业应用。

　　颠覆式的大模型和AI应用加速推动AI步入产业落地新阶段。AI下半场，昆仑芯凭借在芯片架构、集群系统、软件生态领域的深厚积累和全栈优势，竞争实力越发凸显。

　　目前，昆仑芯已实现三代产品大规模部署落地，通过与数百家客户紧密合作，将AI算力输送到互联网、运营商、智算、金融、能源电力、汽车等等千行万业，惠及数以亿计的终端用户。面向未来，昆仑芯将持续深耕AI芯片技术研发和产业应用，为我国AI产业发展注入源源不断的澎湃动力。

（"Note: The information presented in this article is gathered from the internet and is provided as a reference for educational purposes. It does not signify the endorsement or standpoint of our website. If you find any content that violates copyright or intellectual property rights, please inform us for prompt removal."）

行业新闻

极速响应，开放协同：昆仑芯高效适配智谱旗舰模型GLM-5.2

　　6月17日，智谱GLM-5.2模型正式开源发布。昆仑芯在模型开源当日完成对该模型的适配与联合精调，成为首批完成适配的国产算力厂商之一，再次彰显其在主流大模型生态中的敏捷响应能力与广泛兼容实力，持续推动国产算力与模型生态协同演进。　　长程任务能力再突破，GLM-5.2开启Agent工程新阶段据悉据悉，作为智谱最新一代开源模型，GLM-5.2进一步提升了超长上下文理解与工程级任务执行能力，支持真正可用的1M上下文窗口，在长程任务基准测试中保持领先表现，能够高效完成跨文档理解、多轮推理、复杂规划等高难度任务。在全球百万用户参与盲测的前端开发评估系统Code Arena上，GLM-5.2取得全球可用模型第一的表现。　　GLM-5.2在前端、后端、长程任务等开发场景下的成功率相比前一代GLM-5.1都有长足提升，复杂系统工程与深度调试更稳。在主流编程基准上，GLM-5.2保持开源SOTA，与Claude Opus 4.8处于可比区间。　　依托稳定的长链路执行能力，GLM-5.2能够自主推进复杂任务流程，并在长时间运行过程中持续保持高质量输出。相较于GLM-5.1，其在前后端开发、复杂系统工程、代码生成与深度调试等场景中的任务成功率进一步提升，以更强的可靠性与工程化能力，为开发者构建智能应用提供有力支撑。　　开源即适配，昆仑芯再次实现极速响应　　随着国产大模型迭代持续提速，算力平台的响应能力正成为影响模型落地效率的重要因素。智谱GLM-5.2正式开源当日，昆仑芯即完成适配，使开发者能够第一时间获得稳定、高效的国产算力支持。此次适配，是继GLM-4.7、GLM-5、GLM-5.1之后，昆仑芯再次实现对智谱旗舰模型的极速响应，进一步验证了其面向主流大模型生态的敏捷适配能力。依托自研架构与持续优化的软件能力，昆仑芯不断提升算子覆盖范围与生态兼容水平，实现模型性能与算力效率的高效匹配。在本次适配过程中，昆仑芯实现了GLM-5.2的精度无损迁移与高效部署，在保障模型稳定运行的同时充分释放硬件计算性能，降低部署门槛，缩短模型从开源发布到产业应用的落地周期，为GLM-5.2前沿能力的快速释放提供坚实的国产算力底座。支撑这一快速适配能力的，是昆仑芯长期深耕打造的自研软件栈。围绕开发者需求，昆仑芯构建了覆盖底层驱动、开发工具SDK、专业算子库等核心环节的自研软件栈，为模型快速迁移、高效部署与稳定运行提供系统性保障。依托成熟的软件生态与持续演进的底层能力，开发者能够以更低成本、更高效率完成模型部署与应用创新，加速先进模型能力向产业价值转化。　　“发布即适配”成常态，生态协同全面提速　　当前，国产大模型迭代周期持续缩短，从过去以月计逐步演变为以周计。面对不断加快的模型创新节奏，算力平台的响应速度已成为影响先进模型触达开发者与最终用户效率的重要因素。面对智谱GLM系列模型的持续升级，昆仑芯始终保持同步跟进。从GLM-4.7、GLM-5、GLM-5.1到GLM-5.2，昆仑芯均在模型开源后第一时间完成适配与优化，不断缩短先进模型从技术发布到实际应用的时间周期，持续提升国产模型生态的协同效率。　　协同共进，加速国产AI生态繁荣　　从GLM-5到GLM-5.2，智谱旗舰模型在不足半年的时间内完成多次迭代，折射出国产大模型生态快速演进的发展态势。在这一过程中，模型创新与算力平台之间的协同效率，正成为决定技术突破能否转化为产业价值的关键因素。面向未来，昆仑芯将继续秉持开放协同的发展理念，与模型厂商、开发者及产业伙伴携手推进生态共建，以高效适配加速创新扩散，以协同创新释放产业价值，共同推动国产AI生态迈向更加开放、繁荣的发展新阶段。

2026-06-18 09:40 reading：304

model	brand	Quote
MC33074DR2G	onsemi
BD71847AMWV-E2	ROHM Semiconductor
RB751G-40T2R	ROHM Semiconductor
CDZVT2R20B	ROHM Semiconductor
TL431ACLPR	Texas Instruments

model

brand

Quote

onsemi

ROHM Semiconductor

ROHM Semiconductor

ROHM Semiconductor

Texas Instruments

model	brand	To snap up
TPS63050YFFR	Texas Instruments
BU33JA2MNVX-CTL	ROHM Semiconductor
ESR03EZPJ151	ROHM Semiconductor
STM32F429IGT6	STMicroelectronics
BP3621	ROHM Semiconductor
IPZ40N04S5L4R8ATMA1	Infineon Technologies

model

brand

To snap up

Texas Instruments

ROHM Semiconductor

ROHM Semiconductor

STMicroelectronics