昆仑芯漆维:多维度创新应对大模型时代的算力挑战

Release time:2023-09-08
author:AMEYA360
source:昆仑芯
reading:4011

  近日,2023百度云智大会于北京圆满落幕。众多人工智能领域专家、行业精英、意见领袖等齐聚一堂,共同站在大模型重构未来的新起点,展望大模型创新发展之路。

  作为百度四层架构的坚实算力底座,昆仑芯携两代芯片产品重磅亮相主会场及“智能计算&大模型技术论坛”展区。昆仑芯科技芯片研发总监漆维在专题论坛上进行精彩主题演讲,获得与会嘉宾及各级媒体的广泛关注。

  大会期间,昆仑芯以多媒体形式展示芯片产品的领先性能优势,为嘉宾直观呈现昆仑芯产品强大性能以及赋能千行百业的落地成果。

  在百度的四层架构中,昆仑芯作为强大算力底座,通过对市场需求的深刻洞察,率先布局大模型领域。同时,昆仑芯与框架、模型、应用层高效协同,通过端到端软硬逐层优化,携手打造大模型端到端解决方案,实现了百家客户、数万片规模部署。

昆仑芯漆维:多维度创新应对大模型时代的算力挑战

  昆仑芯科技芯片研发总监 漆维

  “智能计算&大模型技术论坛”上,昆仑芯科技芯片研发总监漆维带来了“昆仑芯端到端大模型算力解决方案”主题分享。面对大模型时代计算的效率和成本问题,昆仑芯通过架构创新、产品定义创新以及软件创新,打造出基于自研核心架构XPU-R的大模型产品矩阵。针对不同参数量级的大模型场景,昆仑芯兼具显存和成本优势:

  *昆仑芯AI加速卡R200-8F面向百亿以内参数量级,相比同类型产品性能提升20%;

  *昆仑芯AI加速器组R480-X8面向百亿至千亿参数量级,性能达到同类型产品的1.5倍以上;

  *昆仑芯AI加速器组R480-X8集群针对千亿以上参数量级,可实现多机多卡分布式推理。

  “作为一款人工智能芯片,从芯片完成设计到真正走向行业落地,生态是其中非常重要的环节。”漆维在演讲中分享了昆仑芯在软件生态方面的成果。目前,昆仑芯提供了针对大模型场景的昆仑芯XFT(XPU Faster Transformer)推理加速库、丰富的云原生插件。同时,昆仑芯已全面拥抱最大的大模型开源社区HuggingFace,打造了xHuggingface开源推理套件,并携手飞桨等生态伙伴构建软硬一体的AI芯片生态。

  当前,大模型的技术生态正快速发展,驱动产业实践、行业创新应用,而这离不开AI产业链各企业的加持。在圆桌论坛环节,漆维与同台专家、优秀企业家代表围绕“大模型创新发展之路”展开深入探讨。

  漆维表示:“大模型技术的发展为国内AI芯片企业带来了良好的前景,但也带来了算力需求及成本的挑战。昆仑芯始终坚持开拓创新,降低AI算力成本与使用门槛,加强与AI产业链上下游企业的合作,为市场提供更优质的产品和服务。目前,已有两代昆仑芯AI芯片实现量产和规模部署,而在研的下一代产品将为大模型和AIGC等应用提供更佳的性能体验。”

  AI算力正成为数字基建的新抓手,以及制约大模型技术发展的关键要素。作为AI芯片领域的领军企业,昆仑芯将继续秉承“让计算更智能”的使命,打造更高性能的芯片产品,提供更普惠的AI算力,携手生态伙伴领跑大模型产业落地。

  关于昆仑芯

  昆仑芯前身为百度智能芯片及架构部,于2021年4月完成独立融资,首轮估值约130亿元。核心团队在国内最早布局AI加速领域,深耕十余年,是一家在体系结构、芯片实现、软件系统和场景应用均有深厚积累的AI芯片企业。

  秉承着“让计算更智能”的使命,昆仑芯专注打造拥有强大通用性、易用性和高性能的通用AI芯片。目前,昆仑芯已实现两代通用AI芯片系列产品的量产及落地应用,在互联网、智慧工业、智慧交通、智慧金融等领域均有规模部署,帮助企业加速产业智能化布局,将AI算力赋能千行百业。如需选购昆仑芯产品,欢迎咨询AMEYA360商城在线客服!

("Note: The information presented in this article is gathered from the internet and is provided as a reference for educational purposes. It does not signify the endorsement or standpoint of our website. If you find any content that violates copyright or intellectual property rights, please inform us for prompt removal.")

Online messageinquiry

reading
极速响应,开放协同:昆仑芯高效适配智谱旗舰模型GLM-5.2
  6月17日,智谱GLM-5.2模型正式开源发布。昆仑芯在模型开源当日完成对该模型的适配与联合精调,成为首批完成适配的国产算力厂商之一,再次彰显其在主流大模型生态中的敏捷响应能力与广泛兼容实力,持续推动国产算力与模型生态协同演进。  长程任务能力再突破,GLM-5.2开启Agent工程新阶段据悉据悉,作为智谱最新一代开源模型,GLM-5.2进一步提升了超长上下文理解与工程级任务执行能力,支持真正可用的1M上下文窗口,在长程任务基准测试中保持领先表现,能够高效完成跨文档理解、多轮推理、复杂规划等高难度任务。在全球百万用户参与盲测的前端开发评估系统Code Arena上,GLM-5.2取得全球可用模型第一的表现。  GLM-5.2在前端、后端、长程任务等开发场景下的成功率相比前一代GLM-5.1都有长足提升,复杂系统工程与深度调试更稳。在主流编程基准上,GLM-5.2保持开源SOTA,与Claude Opus 4.8处于可比区间。  依托稳定的长链路执行能力,GLM-5.2能够自主推进复杂任务流程,并在长时间运行过程中持续保持高质量输出。相较于GLM-5.1,其在前后端开发、复杂系统工程、代码生成与深度调试等场景中的任务成功率进一步提升,以更强的可靠性与工程化能力,为开发者构建智能应用提供有力支撑。  开源即适配,昆仑芯再次实现极速响应  随着国产大模型迭代持续提速,算力平台的响应能力正成为影响模型落地效率的重要因素。智谱GLM-5.2正式开源当日,昆仑芯即完成适配,使开发者能够第一时间获得稳定、高效的国产算力支持。此次适配,是继GLM-4.7、GLM-5、GLM-5.1之后,昆仑芯再次实现对智谱旗舰模型的极速响应,进一步验证了其面向主流大模型生态的敏捷适配能力。依托自研架构与持续优化的软件能力,昆仑芯不断提升算子覆盖范围与生态兼容水平,实现模型性能与算力效率的高效匹配。在本次适配过程中,昆仑芯实现了GLM-5.2的精度无损迁移与高效部署,在保障模型稳定运行的同时充分释放硬件计算性能,降低部署门槛,缩短模型从开源发布到产业应用的落地周期,为GLM-5.2前沿能力的快速释放提供坚实的国产算力底座。支撑这一快速适配能力的,是昆仑芯长期深耕打造的自研软件栈。围绕开发者需求,昆仑芯构建了覆盖底层驱动、开发工具SDK、专业算子库等核心环节的自研软件栈,为模型快速迁移、高效部署与稳定运行提供系统性保障。依托成熟的软件生态与持续演进的底层能力,开发者能够以更低成本、更高效率完成模型部署与应用创新,加速先进模型能力向产业价值转化。  “发布即适配”成常态,生态协同全面提速  当前,国产大模型迭代周期持续缩短,从过去以月计逐步演变为以周计。面对不断加快的模型创新节奏,算力平台的响应速度已成为影响先进模型触达开发者与最终用户效率的重要因素。面对智谱GLM系列模型的持续升级,昆仑芯始终保持同步跟进。从GLM-4.7、GLM-5、GLM-5.1到GLM-5.2,昆仑芯均在模型开源后第一时间完成适配与优化,不断缩短先进模型从技术发布到实际应用的时间周期,持续提升国产模型生态的协同效率。  协同共进,加速国产AI生态繁荣  从GLM-5到GLM-5.2,智谱旗舰模型在不足半年的时间内完成多次迭代,折射出国产大模型生态快速演进的发展态势。在这一过程中,模型创新与算力平台之间的协同效率,正成为决定技术突破能否转化为产业价值的关键因素。面向未来,昆仑芯将继续秉持开放协同的发展理念,与模型厂商、开发者及产业伙伴携手推进生态共建,以高效适配加速创新扩散,以协同创新释放产业价值,共同推动国产AI生态迈向更加开放、繁荣的发展新阶段。
2026-06-18 09:40 reading:304
极速适配,生态共赢:昆仑芯高效支持MiniMax M3模型
  6月12日,MiniMax M3模型正式开源。昆仑芯第一时间完成对该模型的适配与调优,成为首批完成适配的国产算力厂商之一,再次彰显其在主流大模型生态中的敏捷响应能力和广泛兼容实力。  据悉,MiniMax M3采用全新的自研注意力架构MSA(MiniMax Sparse Attention),具备前沿Coding、超长上下文、原生多模态能力,在 Artificial Analysis综合智能指数排行榜上,M3取得了全球开源SOTA的最高成绩。作为原生多模态模型,M3从训练起点便融合文本、图片、视频混合数据,支持图片视频理解及电脑桌面操作,为构建复杂智能体任务提供了坚实基础。  极速适配落地,验证全栈生态实力随着AI大模型向更高参数规模、更强性能表现和更广应用场景持续演进,底层算力的适配能力已成为决定模型落地效率的关键环节。昆仑芯在MiniMax M3模型正式开源当日,率先实现“模型发布即适配”,使用户在模型上线当日即可获得稳定、高效的国产算力支持。实际适配中,昆仑芯展现出强劲的算力支撑与灵活的部署优势,能够稳定支撑海量数据处理,支持多种混合精度计算,为MiniMax M3模型持续调优与规模化部署提供了可靠基础。凭借稳定高效的产品表现,昆仑芯充分验证了自研软件栈在模型快速迁移、性能释放及生态兼容方面的综合实力。这一高效适配的背后,是昆仑芯自研软件栈的长期积累。昆仑芯软件栈完整覆盖从底层驱动、开发工具SDK到专业库等核心组件,贴合开发者实际使用习惯,在保障计算性能充分释放的同时,有效降低开发门槛与模型迁移成本。开发者得以高效完成精度无损、性能稳定的模型部署,显著提升模型开发效率与应用部署体验。 拓展生态边界,"发布即可用"成常态近期,国产大模型生态持续演进,技术突破与产业落地节奏显著加快。昆仑芯持续扩大“发布即适配”生态覆盖范围,引领国产AI生态建设。目前,公司已构建起体系化的模型适配机制,能够快速响应主流模型的迭代升级,已实现对MiniMax、智谱GLM、通义千问Qwen等头部厂商最新旗舰模型的快速适配,覆盖语言、多模态、AIGC等方向。凭借成熟开放的软件生态,昆仑芯已将"发布当日即适配"变为常态,让开发者和用户在模型上线当日便能享受国产AI芯片带来的高效加速体验。昆仑芯软件负责人王勇表示:“大模型快速演进对算力平台的适配效率提出了更高要求。我们通过持续优化自研软件栈能力,实现模型发布即适配、上线即可稳定运行,帮助开发者缩短迁移周期、稳定释放性能。此外,我们将持续完善软件生态建设,提升对主流模型架构与算法创新的支持能力,为国产大模型生态发展提供更坚实的算力支撑。” 软硬协同驱动,赋能国产模型加速落地  国产算力的高效适配能力,正成为推动大模型规模化落地的重要支撑。面向未来,昆仑芯将进一步强化对主流模型的高效适配能力,夯实国产AI算力底座。依托软硬协同的深度优化能力,持续聚焦行业应用与场景需求,为千行百业客户及开发者提供高性能、易部署、可规模化的算力支撑,助力AI技术加速落地,推动产业智能化升级与数字化转型迈向新高度。
2026-06-15 10:43 reading:320
昆仑芯Day 0极速适配商汤日日新SenseNova U1模型
  4月28日,商汤正式发布并开源原生理解生成统一模型——商汤日日新SenseNova U1系列。在模型发布当日,昆仑芯即完成对SenseNova U1的极速适配,成为率先完成该模型适配的国产算力厂商之一。  SenseNova U1系列模型能够将语言与视觉信息作为统一的复合体直接建模,实现语言和视觉信息的高效协同,让理解与生成能力同步增强,在保留语义丰富度的同时,维持像素级的视觉保真度。在逻辑推理与空间智能等方向上,它能够深度理解物理世界的复杂布局与精细关系;在未来,它还能为机器人提供具身大脑,实现在单一模型闭环内完成从复杂环境感知、逻辑推演到精准任务执行的全过程,为推动技术与产业发展提供重要基础与关键引擎。  SenseNova U1是基于统一表征空间构建的,更像是一个从一开始就同时掌握多项技能的人。它不是先看懂图像、再翻译成文字、再交给另一个系统理解,而是在同一套“思考方式”里直接处理图像、文字等不同信息。图像和语言不再是两套系统之间的接力,而是在同一个大脑中自然融合。能力表现上,在涵盖图像理解、图像生成与编辑、空间智能和视觉推理的多项基准测试中,SenseNova U1 Lite均达到同量级开源模型SOTA水平,为统一多模态理解与生成树立了新的标杆。仅凭8B-MoT的较小规格,就能达到乃至超越部分大型商业闭源模型。  在实际适配过程中,昆仑芯依托自研架构,持续完善算子覆盖与生态兼容能力,实现模型性能与算力效率的高效匹配。通过底层算子优化与软硬件协同加速,SenseNova U1已在昆仑芯平台上实现高吞吐、低延迟的稳定运行,在复杂任务与长序列场景中依然保持优异表现。针对图文交错生成、高密度信息图生成等应用,昆仑芯对其进行专项调优,实现了高效、高精度的推理性能,让开发者和企业无需复杂的底层适配与性能调优,即可完整调用模型能力。  高效适配的背后,是昆仑芯自研软件栈的出色兼容性与适配能力。为全面释放产品性能,昆仑芯已构建面向开发者的软件栈,并提供从底层驱动到专用库的完备能力,全面覆盖模型开发与部署关键环节。该软件栈高度兼容主流AI开发生态,在保障计算性能充分释放的同时,有效降低开发门槛与模型迁移成本,使客户能够以更低的适应成本与更短的部署周期完成AI模型开发与部署落地,加速从研发到应用的转化。  近期,国产大模型生态迎来密集升级,技术突破与产业落地节奏持续提速。昆仑芯当前已完成对多款主流大模型的首发适配,稳步实现 “发布即支持”的快速落地能力,推动模型技术迭代与算力底座同频演进,充分展现其在软硬协同、生态兼容与工程化落地方面的综合实力。这一核心能力,不仅有效降低模型部署与应用门槛,更助力AI应用规模化拓展,持续领跑国产算力生态适配进度。  国产算力的高效适配能力,正成为大模型规模化落地的关键支撑。面向未来,昆仑芯将通过持续的性能优化与架构迭代,不断刷新国产大模型在国产硬件上的运行表现。依托持续的技术创新与软硬协同优势,昆仑芯将持续夯实国产AI算力底座,助力产业智能化升级与数字化转型加速推进,共绘国产AI发展新蓝图。
2026-04-29 09:42 reading:608
Day 0适配Xiaomi MiMo-V2.5-Pro,昆仑芯持续加速国产大模型落地
  今日,小米正式发布并开源MiMo-V2.5-Pro模型。昆仑芯在发布当日即完成对MiMo-V2.5-Pro的极速适配,成为首批实现适配的国产算力厂商之一,再次验证其在主流大模型生态中的敏捷响应能力与广泛兼容能力。  据悉,MiMo-V2.5-Pro是小米迄今最强大的模型,可支撑MiMo-V2.5-Pro的1T超大参数量、以及1M 超长上下文的高吞吐推理。在通用智能体能力、复杂软件工程以及长程任务等维度上,它已能与全球顶尖Agent模型(Claude Opus4.6、GPT-5.4等)正面较量,相较上一代MiMo-V2-Pro实现了全方位跃升。此外,该模型在Agent场景下的指令遵循能力也明显提升——既能精准捕捉上下文中的隐性要求,又能在超长周期内保持逻辑一致。适用于大型项目编程、数据分析等企业级应用场景,也适用于接入OpenClaw、Hermes Agent、Claude Code等Agent框架。  在实际适配过程中,昆仑芯依托自研架构,持续提升算子覆盖与生态兼容能力,实现模型性能与算力效率的高效匹配。通过底层算子优化与软硬件协同加速,MiMo-V2.5-Pro已在昆仑芯平台上实现高吞吐、低延迟的稳定运行,并在复杂任务与长序列场景中保持优异表现,使开发者与企业用户能够实现“零成本迁移、即部署即用”。  此次高效适配的背后,是昆仑芯在软硬件协同方面的长期深耕。为充分释放产品性能,昆仑芯构建了面向开发者的全栈软件体系,完整覆盖从底层驱动到开发工具SDK及专业库,兼顾高效易用与工程化落地。昆仑芯软件栈高度兼容主流AI开发生态,在显著降低开发门槛的同时,最大化释放计算性能,帮助客户以更低适配成本和更短部署周期完成模型开发与落地,加速模型从研发到应用的转化。本次Day 0适配,标志着昆仑芯与Xiaomi MiMo在“国产算力+国产大模型”协同发展路径上进一步深化,也为全球AI生态的开放与繁荣注入新的动能。近期,国产大模型生态持续演进,技术突破与产业落地节奏显著加快。在此背景下,昆仑芯已构建起体系化、高效率的模型适配能力,能够快速响应主流模型的迭代升级。目前已全面覆盖MiniMax、智谱、通义千问等头部厂商的最新旗舰模型,能力横跨语言、多模态、OCR与文生图等关键方向。当前,昆仑芯正持续深化模型适配与性能优化能力,全面支持多样化模型架构与算法创新,不断提升开发与部署效率。面向未来,将持续深耕全栈技术研发,强化软硬协同与生态共建,不断夯实国产AI算力底座,为国产AI的高质量发展提供源源不断的算力动能。
2026-04-29 09:27 reading:598
  • Week of hot material
  • Material in short supply seckilling
model brand Quote
RB751G-40T2R ROHM Semiconductor
CDZVT2R20B ROHM Semiconductor
MC33074DR2G onsemi
BD71847AMWV-E2 ROHM Semiconductor
TL431ACLPR Texas Instruments
model brand To snap up
BU33JA2MNVX-CTL ROHM Semiconductor
ESR03EZPJ151 ROHM Semiconductor
BP3621 ROHM Semiconductor
STM32F429IGT6 STMicroelectronics
IPZ40N04S5L4R8ATMA1 Infineon Technologies
TPS63050YFFR Texas Instruments
Hot labels
ROHM
IC
Averlogic
Intel
Samsung
IoT
AI
Sensor
Chip
About us

Qr code of ameya360 official account

Identify TWO-DIMENSIONAL code, you can pay attention to

AMEYA360 weixin Service Account AMEYA360 weixin Service Account
AMEYA360 mall (www.ameya360.com) was launched in 2011. Now there are more than 3,500 high-quality suppliers, including 6 million product model data, and more than 1 million component stocks for purchase. Products cover MCU+ memory + power chip +IGBT+MOS tube + op amp + RF Bluetooth + sensor + resistor capacitance inductor + connector and other fields. main business of platform covers spot sales of electronic components, BOM distribution and product supporting materials, providing one-stop purchasing and sales services for our customers.

Please enter the verification code in the image below:

verification code