昆仑芯全面适配智源AI硬件一体化评测引擎FlagPerf-Ameya360电子元器件采购网

昆仑芯全面适配智源AI硬件一体化评测引擎FlagPerf

发布时间：2023-08-25 09:50

作者：AMEYA360

来源：网络

阅读量：3084

　　近日，昆仑芯与北京智源人工智能研究院(以下简称“智源”)面向多种AI硬件的一体化评测引擎FlagPerf完成阶段性适配。昆仑芯是FlagPerf首批生态伙伴，双方将强强联合，共同推进AI软硬件评测体系建设，赋能大模型技术创新能力提升，加速我国AI生态繁荣发展。

昆仑芯全面适配智源AI硬件一体化评测引擎FlagPerf

　　FlagPerf是智源联合各大AI软硬件厂商建立的开源、开放、灵活、公正、客观的面向多种AI硬件的一体化评测引擎，可快速高效地对AI软硬件进行适配和评测，解决当前AI软硬件所面临的兼容性差、技术栈异构程度高、应用场景复杂多变等挑战。目前FlagPerf已经适配了涵盖CV、NLP、语音、大模型等领域的近20个经典模型，支持评测AI硬件的训练和推理能力，未来还将持续拓展支持模型数量和评测领域，包括不限于AI服务器、图计算各个场景，期望全面、立体地刻画厂商的软硬件实力，并通过不断迭代评测体系，紧跟AI产业发展浪潮。

　　作为AI加速领域的领军企业，昆仑芯持续推进软硬协同技术创新，在短时间内高效完成了十数个模型的适配和调优工作，并在FlagPerf项目中全面开源。这批模型能非常高效地完成适配并发布，充分展现了昆仑芯优秀的泛化能力和软硬件兼容性，这主要得益于100%自研的昆仑芯XACC AI编译器(XPU AI Compiler Collection)。

　　昆仑芯XACC AI编译器

　　可自动帮助用户完成开源模型到XPU设备的迁移工作，并实现全自动性能优化，将XPU硬件算法发挥到极致;

　　具有零代码侵入、零环境侵入的特点，用户无需修改模型代码，无需修改部署环境，即可将模型迁移到XPU设备;

　　已全面支持Megatron、DeepSpeed等大模型训练框架，用户可以零成本适配最流行的LLM技术与模型。

　　智源研究院是国际知名的人工智能前沿研究机构，在中国最早引领开展大模型研究，并率先倡导建设大模型开源生态。「悟道」人工智能大模型项目，连创“中国首个+世界最大”纪录，“悟道3.0”进入全面开源阶段。FlagOpen大模型技术开源体系，由智源联合多家企业、高校和科研机构共建，旨在共建共享大模型时代的“新Linux”开源开放生态。面向多种AI硬件的一体化评测引擎FlagPerf是FlagOpen的重要组成部分。

　　针对智源大模型，昆仑芯已在悟道·天鹰(Aquila)语言大模型上完成了大规模推理性能验证，在悟道·视界EVA-CLIP视觉大模型上也实现了适配。

　　此前，昆仑芯已正式加入智源FlagOpen(飞智)大模型技术开源体系，携手多家顶尖硬件企业与高校科研团队共建“北京国家新一代人工智能创新发展试验区AI开放生态实验室”，加速完善芯片软件生态建设。

　　此次昆仑芯与智源FlagPerf完成适配是双方生态共建的又一重要里程碑。智源和昆仑芯将充分发挥各自优势，共同携手产业链上下游合作伙伴，促进技术、资源、场景等多方主体的合作，助力企业更好应对大模型应用时面临的算力不足、场景不够开放等问题，进一步推动我国大模型的技术研发和应用落地。

（备注：文章来源于网络，信息仅供参考，不代表本网站观点，如有侵权请联系删除！）

行业新闻

昆仑芯超节点产品推出，大模型训推任务性能跨越式提升

　　开年后，随着DeepSeek席卷千行百业，昆仑芯率先适配、业内首家单机部署满血版展示卓越性能，并在互联网、科研、金融等领域实现规模部署，一系列进展引发广泛关注。刚刚落幕的Create2025百度AI开发者大会上，昆仑芯作为底层算力核心被高频提及，三万卡集群点亮振奋人心，昆仑芯超节点也在大会上正式发布。　　自ChatGPT问世，大模型参数快速增长，单卡显存无法容纳越来越大的模型参数，大模型对AI算力系统的并行通信能力提出越来越高的要求;同时开源MoE模型在多专家并行过程中也需要更高的通信效率。DeepSeek-V3/R1加速产业落地，AI算力集群对系统可扩展能力的需求变得空前迫切。　　基于对大模型演进趋势及算力需求的前瞻预测，昆仑芯团队率先布局、潜心研发，面向大规模算力场景推出超节点新品，为AI算力集群性能优化和效率提升提供一套全栈解决方案。　　昆仑芯超节点渲染图　　1.全互联通信带宽提升8倍，训推性能跨越式提升　　通过硬件架构创新，昆仑芯超节点突破传统单机8卡产品形态，超高密度设计使得单柜可容纳32/64张昆仑芯AI加速卡。单柜内卡间实现全互联通信，带宽提升高达8倍，一个机柜的算力最高可达到传统形态下8台8卡服务器，实现对MoE大模型单节点训练性能5-10倍、单卡推理效率13倍的大幅提升。　　2.整柜功率可支持到120kW，大幅降低PUE　　在能耗和散热方面，昆仑芯积极响应节能降耗政策，采用高效的冷板式液冷方式进行系统散热，整柜功率可支持到120kW，大幅降低数据中心的PUE(Power Usage Effectiveness，数据中心消耗的所有能源与IT负载消耗的能源的比值)。不仅如此，昆仑芯超节点支持液冷系统的漏液检测，可及时针对液冷故障进行预警、告警、修复等，最大化提高整机柜系统无间断稳定运行效率。　　3.机柜间IB/RoCE通信，高带宽、低延迟　　当前，各级政府、众多行业和头部企业集中发力，正在加快建设一批超大规模智算中心。针对集群拓展需求，昆仑芯超节点机柜间支持IB/RoCE通信，可实现跨柜高带宽、低延迟的数据传输，支持万卡以上规模的智算集群构建。　　4.自研XPU Link，兼容主流scale-up通信标准　　昆仑芯自研互联通信协议XPU Link，秉承一贯的“共生共赢”发展理念，昆仑芯XPU Link兼容scale-up通信标准OISA，与上下游合作伙伴共建超节点行业生态，携手推动国产AI算力在超节点集群中的规模部署和产业应用。　　颠覆式的大模型和AI应用加速推动AI步入产业落地新阶段。AI下半场，昆仑芯凭借在芯片架构、集群系统、软件生态领域的深厚积累和全栈优势，竞争实力越发凸显。　　目前，昆仑芯已实现三代产品大规模部署落地，通过与数百家客户紧密合作，将AI算力输送到互联网、运营商、智算、金融、能源电力、汽车等等千行万业，惠及数以亿计的终端用户。面向未来，昆仑芯将持续深耕AI芯片技术研发和产业应用，为我国AI产业发展注入源源不断的澎湃动力。

2025-04-27 11:10 阅读量：2627

型号	品牌	询价
RB751G-40T2R	ROHM Semiconductor
CDZVT2R20B	ROHM Semiconductor
MC33074DR2G	onsemi
BD71847AMWV-E2	ROHM Semiconductor
TL431ACLPR	Texas Instruments

型号

品牌

询价

ROHM Semiconductor

ROHM Semiconductor

onsemi

ROHM Semiconductor

Texas Instruments

型号	品牌	抢购
BP3621	ROHM Semiconductor
STM32F429IGT6	STMicroelectronics
TPS63050YFFR	Texas Instruments
IPZ40N04S5L4R8ATMA1	Infineon Technologies
ESR03EZPJ151	ROHM Semiconductor
BU33JA2MNVX-CTL	ROHM Semiconductor

型号

品牌

抢购

ROHM Semiconductor

STMicroelectronics

Texas Instruments

Infineon Technologies

ESR03EZPJ151