美光丨当存储设备加入冷却回路:专为冷板设计的SSD

Release time:2026-04-23
author:AMEYA360
source:美光
reading:245

  我们现在使用的 GPU 服务器可能很快就会告别风冷散热。举个例子,目前的风冷系统可能占据 8U 机架空间,如果在前方部署 8 块 SSD,充足的气流可确保所有设备均在规格要求范围内运行。而在新推出的服务器中,由于标配液冷系统,同样的 8 路 GPU 配置所占空间已缩减至 2U。¹突然之间,机箱之内已经没有足够宽敞的空间来从容部署 8 块 SSD 了。这 8 块 SSD 只能挤在一个狭小的空间内,热量聚集,温度很快上升,如果不能及时排出,很容易引发问题。

  面对这一新现实,美光开始进行液冷 SSD 设计。存储设备必须主动接入冷却回路,不能被动等待。采用 E1.S(9.5 毫米)外形规格的美光 9650 NVMe™ SSD,正是美光为了上述目的从零开始打造的新一代液冷 SSD 产品。

美光丨当存储设备加入冷却回路:专为冷板设计的SSD

  在本博客中,我会详细介绍液冷技术对 SSD 的重要性、冷板散热的工作原理,以及为何 9650 SSD 的单面架构是实现高效冷板接触的理想设计。

  有关散热效率的数学计算

  在我们的技术简报中,我们针对配备 32 块 NVMe SSD(每块功耗 25W,总功耗 800W)的服务器,在两种温度场景下进行了建模。对于风扇驱动的气流和泵驱动的液冷系统,我们使用了标准的传热方程,并结合了与实际相符的效率假设。我们模拟了两种情况:一种情况下,数据中心环境温度与 SSD 温度相差 11.1°C,另一种情况温差较小,为 8.3°C。如果温差较大,风冷的效率会提高,这也意味着风冷系统对数据中心环境温度的变化更为敏感。

美光丨当存储设备加入冷却回路:专为冷板设计的SSD

  图 1:风冷散热需要 38-81W 功耗才能带走 32 块 SSD 产生的热量;而液冷系统仅需 0.4-1.4W 即可完成相同任务——功耗降低了约 98%


  冷板可将高导热性金属块和高速流动的冷却液放在尽可能靠近热源的位置,而风冷系统只能在插满 SSD 的硬盘托架上方向 SSD 吹送空气。液冷系统既能降低组件温度,又能大幅减少将热量从服务器中排出所需的能耗。

  而且,液冷系统还能扩展。Vertiv 的一份案例研究跟踪了四种数据中心配置(液冷采用率逐步增加)。² 当液冷比例从 0% 提升至 75%,设施总能耗降低了 10.7%!这不仅包括计算功耗,还涵盖了所有其他方面:暖通空调、风扇、照明,等等。

美光丨当存储设备加入冷却回路:专为冷板设计的SSD

  图 2:随着液冷采用率从 0% 升至 75%,数据中心总能耗下降了 10.7%(来源:Vertiv)

  SSD 冷板散热工作原理

  冷板是一种经过机械加工的金属块,内部带有微通道,通过热界面材料 (TIM) 安装在 SSD 外壳上。水-乙二醇等冷却液流过冷板,直接从器件上吸收热量,然后将热量输送到设施的冷却回路中。

  新设计普遍采用带弹簧的冷板,并配备盲插式快速断开集合管。拔出 SSD 后,冷却液管路会自动断开。将替换件插入到位,它们就会重新连接。这种设计完全保留了热插拔维护能力,对企业级和超大规模部署而言,这种能力是不可或缺的。

美光丨当存储设备加入冷却回路:专为冷板设计的SSD

  图 3:SSD 冷板组件的横截面图,展示了冷却液流动、冷板、热界面材料 (TIM),以及搭载了控制器、DRAM 和 NAND 的印刷电路板 (PCB)

  美光 9650 NVMe PCIe 6.0 SSD:

  专为液冷设计

  在传统 SSD 设计中,控制器、DRAM 和 NAND 等发热器件分散在 PCB 的两个面上。如果冷板只接触其中一侧,另一侧的热量就必须穿过 PCB 板才能传导至冷板。这种设计会增加热阻,降低散热效率,并导致各 NAND 芯片的温度出现差异。诸如双冷板、加厚外壳和辅助散热片等解决方案,不仅会增加成本和复杂性,而且无法从根本上解决问题。这是一个磁盘层面的设计问题,而非系统层面的散热管路架设问题。

美光丨当存储设备加入冷却回路:专为冷板设计的SSD

  图 4:概念设计——传统的双面 E1.S 设计与美光 9650 SSD 的单面液冷优化设计

  美光 9650 SSD 采用了一种创新方案。从上面的示意图中,您可能已经注意到了——我们将大约 90% 的发热器件集中在 PCB 的一侧,而传统设计中这一比例仅为大约 60%。这种创新设计,只需搭配一块冷板,便可让整个散热架构开始工作,并具备以下优势:

  冷板直接接触:在主要发热表面上覆盖一层均匀的传热界面,最大限度降低热阻

  更均匀一致的 NAND 温度:芯片间温差减小,从而提升耐用性和可靠性

  充分释放 PCIe 6.0 速度:即使在更高带宽和功耗下,散热性能仍可与搭配液冷系统的上一代 PCIe 5.0 SSD 相媲美

  标准 E1.S 外形规格:兼容现有 9.5 毫米 EDSFF 液冷机箱,支持热插拔

  对系统层的影响

  磁盘层的设计固然重要,但这种设计的真正价值在于为系统层带来的回报。当 SSD 能够主动接入液冷回路,而非依赖流过自身的气流时,系统设计师便获得了从未拥有过的全新选择:

  存储区域内风扇数量减少(或者完全取消):可以减少为磁盘散热的风扇数量,或者完全取消风扇,从而节省功耗并降低噪音。

  更高的每服务器 SSD 密度:没有了气流间距限制,可以在更小的机架空间内放置更多磁盘。

  对于持续运行的 AI 工作负载,热特性更可预测:液冷系统消除了因 GPU、CPU 和存储设备共享气流而产生的温度波动。

  这些优势,并非停留在理论上。台达电子等生态系统合作伙伴已经开始出货 集成 SSD 冷板的全液冷服务器平台。³美光 9650 支持这些平台,其 E1.S(9.5 毫米)外形规格专为冷板环境设计。ASHRAE TC 9.9 发布的工业环境热指南定义了数据处理设备的允许温度范围⁴,而液冷技术可确保即使在高磁盘密度下,设备的运行温度也低于建议限值。

  还有一个很容易被忽视的因素:效率倍增。人们通常从散热余量角度来讨论液冷技术,但该技术的更大益处体现在每瓦性能上。当数据中心不再因高转速风扇而消耗电力,并且降低了系统级散热开销时,这些节约下来的电力就能转而供其他资源使用。凭借液冷架构,9650 在能效方面较前几代产品显著提升,这不仅有助于实现可持续发展目标,还可直接降低总拥有成本。

  展望未来

  在高密度 AI 基础设施中,SSD 液冷系统正逐渐成为必备配置。Uptime Institute 的《2024 年全球数据中心调查报告》指出,约 20% 的运营商正在部署或计划部署液冷系统。⁵美光 9650 采用的单面架构专为冷板接触而设计,能让 SSD 液冷系统充分发挥作用。

  还有一点:当我们为 SSD 营造出更适宜的工作环境温度时,我们便有可能获得更高的控制器时钟频率、写入吞吐量,以及持续稳定的工作负载性能。美光正在朝着这一目标努力,敬请期待。

美光丨当存储设备加入冷却回路:专为冷板设计的SSD


("Note: The information presented in this article is gathered from the internet and is provided as a reference for educational purposes. It does not signify the endorsement or standpoint of our website. If you find any content that violates copyright or intellectual property rights, please inform us for prompt removal.")

Online messageinquiry

reading
美光的低功耗车规级内存与存储解决方案,赋能端侧AI在汽车领域的应用
美光®助力高性能计算新前沿
  将圆周率 (π) 计算至小数点后 314 万亿位  究竟需要什么?  StorageReview 成功将圆周率 (π) 计算至小数点后 314 万亿位,刷新世界纪录,但其目标绝非仅仅为了开创记录。这是一项有意设计的极端工作负载,旨在对现代服务器的存储系统进行极限压力测试,并回答一个很现实的问题:单个系统是否能持续数月不间断进行 PB 字节级别的 I/O 操作?  在一台 Dell™ PowerEdge™ R7725 服务器上连续计算了 110 多天后,该实验为上述问题给出了肯定的答案——前提是存储架构必须能够提供持续的性能和一致性,而不仅仅是短时间的峰值性能。  测试概览  I/O 马拉松:持续三个多月的高强度混合读/写压力  单台服务器配备超过 2.1 PB 的可用闪存容量  适用于长时间运行的高性能计算 (HPC) 和 AI 作业的关键要点:只有一致性才能确保长期运行后得出结果  为了构建所需的存储架构,StorageReview 搭建了一套包含 40 块美光 6550 ION SSD 的存储系统,每一块 SSD 均为 E3.S 外形规格,可用容量为 60TB。理解该大规模存储系统(无论是 SSD 数量还是总容量)背后的“原因”,对于理解该纪录在现实当中的意义至关重要。  为何该任务需要超过 2 PB 的闪存容量?  要计算位数如此之长的圆周率,重点不在于存储最终结果。与计算过程所需的中间数据相比,最终结果本身所需的存储空间相当小。  由于最后得出的圆周率高达 314 万亿位,该测试所用的应用程序 y-cruncher 需要巨大的暂存空间,以便:  存放用于 FFT 密集型数学运算的大型临时数组  频繁进行全面状态检查,以确保持续数周的工作不会前功尽弃  存放验证数据,确保在长达数月的运行过程中数据准确一致  存放计算过程中使用的多精度中间值  为满足这些要求,StorageReview 在系统中配置了超过 2.1 PB 的可用闪存容量。  40 块美光 SSD 中的 34 块被分配给 y-cruncher,作为暂存空间,形成高带宽工作层  剩余的 6 块 SSD 配置为 RAID10 系统,用于存储最终计算结果  峰值时,该工作负载需要多达 1.43 PiB 的存储空间,单个检查点占用的存储空间高达数百 TB。该容量并非过度配置;而是为了安全、高效地完成计算所必需的容量。  圆周率计算的特点:持续的 I/O 操作  该测试并非一次旨在展示峰值性能的短时间基准测试。圆周率计算任务对存储系统持续施加压力,长达三个多月,期间完全没有停机或恢复的机会。  该工作负载呈现出先进高性能计算和 AI 环境所共有的特征:  持续高带宽读写操作  长时间持续高强度写入操作  要求性能可预测,对突然出现的大量延迟容忍度极低  操作风险——存储故障可能导致数周的工作成果付诸东流  在整个运行期间,该系统始终保持在线状态,从未因任何故障而需要恢复运行。  这一点至关重要,因为许多生产工作负载的失败并非源于峰值性能不足,而是源于系统随时间推移而产生的不稳定或不一致。长时间运行的作业会放大存储堆栈中的微小问题。  单服务器架构中的高密度 NVMe™  长期以来,具有上述特征的工作负载通常会促使团队采用分布式存储系统或多节点集群,以获得足够的容量和聚合 I/O。  然而,StorageReview 仅使用单台服务器机箱就完成了全部计算。  通过在一台 Dell™ PowerEdge™ R7725 服务器中部署 40 块大容量 NVMe SSD,该系统实现了:  无需外部存储阵列即可拥有 PB 级容量  总带宽足以支撑长达数月的计算  一种简化的运行模型,组件和故障域更少  这里的关键不在于每个工作负载都需要在一台服务器上配备数十个硬盘。相反,该测试凸显了现代高密度 NVMe 存储如何改变人们在系统架构上的权衡取舍。某些情况下,过去需要采用横向扩展方案来处理的工作负载,现在可以通过纵向扩展方案来解决。  与现代 HPC 和 AI 工作负载的相关性  尽管该工作负载较为特殊,但在运行过程中观察到的存储行为与某些实际生产环境中的需求高度吻合,这些环境包括:  大规模 AI 训练:经常需要生成 TB 级别的检查点数据,且存储性能会直接影响训练时间  推理管道和特征存储库:可预测的延迟比峰值吞吐量更为重要  科学模拟与建模:任务可能运行数周或数月,重启成本高昂  高级分析管道:大型工作数据集必须靠近计算所在位置  在上述每种情况下,存储的一致性以及随时间推移的耐久性都会直接影响任务的完成、系统利用率以及操作风险。  该记录中的关键技术要点  该测试的目的不仅仅是为了创造一个数学上的里程碑。它展示了当今以存储为中心的计算所涉及的若干现实情况:  PB 级暂存工作负载可完全在 NVMe 上运行  大容量 SSD 能承受极端 I/O 压力,不会出现性能骤降  如今的单节点架构能够处理以往仅能由集群处理的工作负载  性能的一致性和耐久性与原始带宽同样重要  这些结论表明,存储系统日益重要,决定着先进计算工作负载的可行性和效率。  对数据中心战略与基础设施规划的影响  该测试不仅达成了一个技术里程碑,更凸显了存储技术如何日益深刻地影响着现代数据中心的运营成效和架构选择。  对企业和 IT 部门领导者而言,最重要的关注点并非峰值吞吐量,而是大规模运行时可预测的性能。长期运行的工作负载,无论是 AI 训练、大规模分析还是科学计算,都会放大效率低下问题和故障所造成的后果。当存储成为瓶颈时,昂贵的计算资源便会闲置,成本随之攀升,并导致交付延宕。  该测试表明,大容量 NVMe 能够在较长时间内持续为计算提供数据,可消除存储瓶颈,减少意外情况,降低运营风险。  规划基础设施升级时的考虑因素  当团队在规划针对 AI 及其他数据密集型工作负载的升级时,以下几项评估标准变得越来越重要:  持续的吞吐量而非突发性能  短时间的基准测试很难代表实际工作负载。在混合读写负载下持续数月的一致性,比在几分钟内达到的峰值数据更为重要。  每台服务器的性能密度  将 PB 级容量和 I/O 整合到单一系统中的能力,对功耗、空间、网络以及管理开销都会产生影响。  延迟可预测性与尾部行为  平均性能并不能全面反映运行情况。异常的延迟可能会导致流程停滞、检查点推迟,进而导致任务失败。  在稳定负载下的耐久性和可靠性  长时间运行的任务会暴露出在短时间测试中无法发现的问题。随着利用率趋于稳定,存储系统必须始终保持足够高的性能和数据完整性。  简化运营  减少对外部存储架构或大型集群的依赖,可缩小故障的影响范围,并简化部署和扩展。  根据数据中心战略选择存储方案  从该测试中,我们可以获得的一个更广泛的启示是:现代 NVMe 存储让我们能够重新思考如何降低复杂性。在某些场景下,通过在更少的节点上采用更高的存储密度来实现纵向扩展,可以消除横向扩展的需求。这有助于实现:  更少的服务器和互连设备  单位工作量的功耗和散热需求更低  简化的自动化与生命周期管理  更快的部署和恢复时间  这并非意味着不再需要分布式架构,只是为基础设施团队提供了更多切实可行的设计方案。  随着 AI 和分析工作负载的规模不断扩大,持续时间不断加长,存储相关决策将产生越来越大的影响,受影响的方面不仅包括性能,还包括成本效益、韧性以及组织响应速度。  总结  314 万亿位圆周率的计算容不得丝毫差错。该系统在持续负载之下连续运行了 110 多天,按照常理,应该能暴露出其在性能、耐久性或可靠性方面的问题。  然而,没有出现任何问题。  相反,测试结果表明,美光大容量 NVMe SSD 能够提供可持续的性能、运行稳定性和性能密度,其表现足以显著影响基础设施的设计选择。  本文探讨的主题并非圆周率,而是:当存储系统专为支持超大规模、长期运行的数据密集型工作负载而设计时,能够实现哪些可能,且不会出现任何问题。
2026-04-13 09:34 reading:374
美光的智能制造:AI技术在企业中的应用
  制造芯片的复杂程度超过制造火箭。阅读本案例研究,了解美光如何率先在制造、物流和业务流程中应用 AI,并将其大规模部署,从而实现技术优势地位。  美光在利用人工智能 (AI) 技术方面绝不仅限于空谈。公司将数据分析和 AI 应用于自身制造流程,真正做到了言行一致。美光将 AI 融入业务运营的核心,通过业界前沿内存和存储解决方案,彰显其赋能技术的卓越价值。  智能制造是自动化的更高阶段。其关键在于大规模智能感知、决策与优化。智能制造涵盖内容广泛,从仿真和预测分析,到机器学习和生成式 AI 等。这是一项更广泛的企业战略,其中感知 AI 和智能体 AI 发挥着关键作用:感知 AI 通过计算机视觉、声学监听和热成像等技术,使机器能够“看到、听到、感觉到”周围的环境。智能体 AI 系统能够解读这些输入信息并自主行动,持续学习、在复杂的工作流程中进行协调。  这些能力相结合,为美光的制造战略转型提供了支撑,使智能系统能够实时检测异常、优化流程并灵活适应新变化。智能制造带来了诸多优势:更高的良率、更安全的工作环境、大幅提升的效率、更短的产品上市时间,以及更可持续的业务。本案例研究探讨美光如何利用 AI 技术来应对全球最复杂的工程挑战之一:在硅晶圆上制造内存。  复杂的制造工艺  美光的制造工厂在基于硅晶圆开发内存技术时需要使用高度复杂和精密的工艺,耗时数月,涉及约 1,500 个步骤。出错和浪费的可能性很高。利用数据分析和 AI,有助于降低这种可能性。如果仅依靠人类警觉性来发现和跟踪缺陷、机械问题和其他潜在问题领域,公司将会损失时间和金钱。而通过利用当今的前沿 AI 技术来提高准确性和检出率,就可以避免这些损失。  美光智能制造和人工智能企业副总裁 Koen de Backer 表示:“我们在这里打造的东西完全与众不同,能够实现更高水平的准确性。现在,我们可以将产品上市速度加快一倍,同时每年节省 100 万工时。这确实是革命性的成就。”  美光如何将晶圆转化为先进内存  制造先进内存的起点是二氧化硅——一种经提纯后纯度高达 99.999% 的沙子。这种电子级硅原料先被熔铸成硅锭,再切成厚度仅为 0.67 [BG1] 毫米 [E]2] 的超薄晶圆。美光从专业供应商处采购电子级晶圆,然后通过先进的制造系统进行加工,最终生产出高性能内存芯片。  通过扩散工艺,晶圆上的涂层能够均匀分布。添加涂层材料时,每个晶圆都在高速旋转(有时在超热环境中),材料在离心力的作用下沿着表面扩散。  在美光的尖端制造工厂中,这些采购而来的晶圆将经历一系列精密设计的加工步骤——每个环节都旨在将电子级硅原料转化为智能内存,加工精度可达微米级别。  抛光:去除从硅锭切割下来的初始晶圆表面的微小瑕疵,确保形成后续加工所需的光洁表面。  光刻胶涂覆:涂覆光敏材料,以便能够通过光刻技术刻印精密电路图案。  光刻:利用紫外线将设计好的精密电路逐层转印到晶圆上,类似于相片曝光的过程。  掺杂与金属化:加入离子化等离子体(掺杂)来改变晶圆的电学特性,并添加导电金属层以形成互连结构。  添加防护层:用薄膜密封晶圆,以便在测试和搬运过程中保护其中的电路。  检验与检测:通过 AI 增强成像和分类系统验证功能性和结构完整性,并检测人眼无法察觉的缺陷。  整个制造过程在无菌制造室(称为洁净室)中进行,以防止微小的灰尘污染原始晶圆。然而,尽管采取了这些预防措施,晶圆仍然可能存在瑕疵。微小的划痕、保护膜下的气泡、细微的结构缺陷等——若未及时检出,这些小缺陷可能导致整批产品报废。  这些瑕疵通常很微小,肉眼完全看不见。即使可见,检测人员在扫视每片晶圆的 30 到 40 张照片时,也可能会因为眼睛疲劳或暂时走神而未注意到缺陷。眨眼之间,瑕疵品便流向了下一个环节。  如果到测试阶段才发现问题,就会浪费大量时间和金钱。这些瑕疵的根源问题不仅仅只影响一片晶圆,而可能影响成千上万片晶圆。  在生产中还有其他方面也可能会出现问题。设备零部件磨损;管道危险化学品泄漏或滴落到产品或员工身上。我们必须及早发现这些问题并予以纠正。一旦停工,往往就要付出很高的代价,导致收入损失并错失生产良机。由于半导体制造的复杂性,恢复生产需要耗费大量的时间,这可能会使真实成本达到数百万美元。并且,还存在很多与员工受伤相关的风险。最后,为践行美光对可持续发展和卓越运营的承诺,我们应当尽力实现每个流程的高效节能、稳定可靠。  及时检测出产品和机械问题,对于生产效率、效能和安全至关重要。遗憾的是,人难免会犯错。即使是最专业的员工也未必总能察觉出细微的问题迹象。  这正是 AI 大显身手的领域。AI 系统能以激光般的精度和速度检测出人类不易觉察的异常,比如划痕、气泡、设备磨损等,其能力远远超过人类。AI 系统会从超过 590,000 个源收集 PB 级的制造数据 [JB1]——这些数据持续流入美光的云分析环境,以供优化生产流程以及实时发现问题。这些系统包括计算机视觉、声学监听和热成像,当机器具备了这些感知 AI 能力,便能够感知周围环境。  计算机视觉让制造过程“被看见”  美光的 AI 制造基于图像分析技术。Koen 解释道:“图像在半导体制造工艺中具有强大的作用,我们可以分析每个工艺步骤的详细图像。”  他还表示:“通过利用 AI 计算机视觉并分析每个阶段的图像,我们可以快速识别发生的任何偏差。所有过程都完全采用自动化方式。这种分析涵盖各个方面,包括前道、封装与测试。”  在整个晶圆厂和制造工艺中,美光通过 AI 计算机视觉寻找微观层面的潜在瑕疵。  除了图像,美光还采用视频分析来消除封装和测试中的质量问题。您也许会认为视频的数据量太大,因而不太可行。但是,美光同样使用了 AI,来确定需要分析的关键时间点。AI 会适时启动和停止视频流,仅捕获关键过程,从而控制数据量的大小。美光的一大优势是,同时生产内存和存储设备,确保这些宝贵数据能够被采集、保存并随时可用。  图像和视频非常有用,因为晶圆瑕疵有很多种形式。大多数瑕疵属于以下这些常见类型:晶圆边缘附近有小孔,或外层薄膜上有划痕和气泡。在晶圆制造过程中,光刻机在晶圆上蚀刻电路时,其摄像头会捕获一些图像,美光的 AI 系统使用计算机视觉技术在这些图像上识别上述缺陷。  根据工程师的指示,系统会自主扫描晶圆边缘的小点(孔),或者连续或轻微断开的线条(划痕),也可以根据深浅不同的斑点来发现颜色变化。某些缺陷能以近乎实时的速度检出,在拍摄图像后数秒内触发警报。在照片存储几分钟后的二次扫描中可能会发现其他缺陷。所有这些过程都依赖于 AI 系统对数据库环境中存储的数百万张图像进行比较和对照。  事实证明,这些结果比工程师的评估要准确得多,因为 AI 计算机视觉具有更高的准确性和效率。最重要的是,工程师们现在可以专注于数据采集以及根本原因的解决。  美光的 AI 自动缺陷分类 (ADC) 系统进一步简化了这项工作。技术人员和工程师不再需要手动对晶圆缺陷进行分类。借助深度学习技术,AI-ADC 每年可对数百万个缺陷进行分类和归类,并能够自主学习,在迭代中不断提升准确率。这种机器学习方式按类型对缺陷进行聚类处理,可帮助工程师追溯缺陷产生的根本原因,并使 AI 系统能够自主发现缺陷及优化结果。  监听声音  美光除了将 AI 成像作为制造工艺的核心外,还利用声学监听来预防问题。异常声音往往表示部件存在磨损或即将发生故障。  美光的 AI 系统可以通过声学传感器监听工厂机械的异常情况。这些传感器通常有计划地安装在机器人执行装置或泵设备附近。这些麦克风可以连续数周对正常工作状况录音,软件将检测到的频率转换为图形或图表,以视觉数据来描述声音。当出现新的音高或频率时,系统会发出警报。很多情况下,系统甚至可以辨别出发生异常的原因。  搜索这些庞大的数据库可能非常耗时。但当机器有可能发生故障时,工厂经理又需要立即知晓情况。相比基于 CPU 的系统,将数据发送到由 GPU、加速器以及美光的内存和存储设备组成的 AI 系统可以更快获得智能结果。这些 AI 系统具有数十万个 GPU 核心和高带宽内存,可以同时协同工作,瞬间优化结果,几乎无需人工干预。此外,它们还可以在每次迭代中改进诊断机制。  热成像感知  并不是每种故障都会发出声响。在制造环境中,寂静无声也可能隐藏着致命危险。有时候,唯一的预警信号是温度的变化。直到最近,检测温度骤升的方法仍然只有观察红光、火花或烟雾。当这些状况出现时,意味着事态已进入危险阶段,工厂需要尽快疏散员工。  因此,除了图像分析和声学监听外,美光还使用热成像技术测量关键器件的温度。  Koen 解释道:“测量变压器的温度是防止过热的关键。及早发现问题也许只需要进行简单的修理,而如果错过了时机,可能就只能更换整套昂贵的设备。”  最终,这些用于采集图像、声音和温度的 AI 传感器将直接影响公司的利润。Koen 补充道:“这些传感器在提高质量和效率方面表现出色,在成本节约方面同样作用巨大。它们能够实现细粒度的能源计量,从而显著节约原材料和能源。”  数据  美光通过 590,000 个传感器生成 1 亿张晶圆图像,涉及到 4.36 亿个控制点。所有这些数据每周都会通过 AI 模型进行处理。此外,已存储 77 PB 数据,并且每天捕获 58 TB 的新数据。  AI 的大规模采用可支持多种应用,包括良率分析、数字孪生规划、物联网 (IoT) 和图像分析、优化和高级算法、过程自动化以及移动应用。  结果1毋庸置疑:  制造工具可用性提高 4%  每年劳动生产率增加 100 万工时  新品上市时间缩短 50%  产品报废率降低 50%  其效益不仅限于晶圆厂。从销售和市场营销,到人力资源、业务运营、研发及业务系统——AI 现已融入美光运营的方方面面。  Koen 表示:“这是整个企业层面的转型,而不仅仅是车间改造。我们已将 AI 应用于公司内部所有业务流程。”  生态系统合作伙伴关系  美光不仅在内部优化制造工艺,在与供应商直接合作时也使用 AI,向他们提供与产品相关的详细反馈,以确保尽可能提高能效。美光同这些供应商一起协调 DIMS(数据摄入美光系统),尽可能提高数据摄取的频率。美光工程师会实时监控这些摄取状态,同时持续进行精益求精的校正和优化。  此外,美光还使用遥测数据来衡量旗下产品在供应商数据中心内的效果。这些数据与美光内部数据相结合,可支持实时协作,以便改进产品,使其满足特定工作负载的需求。  美光也会密切监控这些模型的表现。使用 AI 处理传入的数据并进行反复训练,工程师能够专注于自动化机器学习的流程。如果不使用 AI,可能数据科学家永远无法腾出手来推动技术发展,他们将忙于研究那些已经发生的各种事件。  这些计划得到了内部数据科学学院的支持,同时公司也在内部数据科学家、工程师和解决方案架构师方面进行了持续投资。通过这些资源以及美光的公民数据科学模型,职能专家能够有效利用 AI 支持的工具和见解。  行业领导力  如今,美光正在将丰富的核心工艺知识与 AI 出类拔萃的效率相结合。数据专家们创建了大型良率管理平台,公司内有 14,000 名员工正在使用这些平台。与此同时,以前专注于日常良率优化的专业团队正在快速集成周期中构建新的原型。团队成员经常会应用这些原型来优化主要平台。  得益于美光团队成员的敬业精神及其开发的 AI 增强型先进制造工艺,公司在多代内存技术的采用过程中均实现了创纪录的良率。凭借最新创新成果,美光的近几代技术能够比前几代更快达到成熟良率,彰显出公司的工程研发与卓越运营能力,并进一步巩固了美光的技术优势地位。  美光针对产品制造不断优化 AI。AI 已不仅是一种工具,更是一种智能系统,彻底改变了生产流程。而真正让美光在 AI 应用领域脱颖而出的,则是通过大规模应用 AI 来重塑整个企业。从仿真与预测分析,到机器学习、生成式 AI 以及实时工艺优化,美光的 AI 战略已渗透至业务的每个角落。新技术不仅不会取代团队成员的工作,反而会为团队助力和赋能,让他们无需再忙于获取数据并进行大量基础分析。现在,他们可以专注于自己擅长的事情——通过创新来开发行业前沿产品及良好业务实践。
2026-04-08 09:48 reading:419
美光宣布:HBM4已批量出货!
  2026年3月16日,美国存储芯片大美光科技正式宣布,其已于2026年第一季度开始批量出货HBM4 36GB 12H内存,该产品专为英伟达(NVIDIA)Vera Rubin平台设计。凭借HBM4,美光实现了超过11 Gb/s的引脚速度,带宽超过2.8 TB/s,相比其HBM3E,带宽提升了2.3倍,能效提升超过20%。  为了进一步提升HBM的容量,美光展示了其先进的封装技术,可将16颗HBM芯片堆叠在一起,并已向客户交付了HBM4 48GB 16H的样品。与HBM4 36GB 12H产品相比,这一里程碑式的改进使每颗HBM芯片的容量提升了33% 。  “下一代人工智能将由整个生态系统通过联合工程创新开发的紧密集成平台定义。我们与英伟达的紧密合作确保了计算和内存从一开始就能协同扩展,”美光科技执行副总裁兼首席商务官 Sumit Sadana 表示。“这一切的核心是美光的 HBM4,它是人工智能的引擎,可提供前所未有的带宽、容量和能效。随着 HBM4 36GB 12H 的推出,以及业界首款 SOCAMM2 和第六代 SSD 的量产,美光的内存和存储构成了释放下一代人工智能全部潜力的核心基础。”  美光SOCAMM2 专为英伟达 Vera Rubin NVL72 系统和独立Vera CPU平台而设计,每个 CPU 可实现高达 2TB 的内存和 1.2 TB/s 的带宽。  美光是首家量产 PCIe Gen6 数据中心级 SSD 的公司。美光 9650 针对能效和液冷环境进行了优化,采用英伟达BlueField-4 STX 参考架构,可为 AI 训练和推理工作负载提供高速、低延迟的数据访问,支持高达 28 GB/s 的顺序读取吞吐量和 550 万随机读取 IOPS。美光 7600 和 9550 SSD 为客户提供 PCIe Gen5 SSD,从而扩展了他们的架构设计选择。
2026-03-19 09:48 reading:491
  • Week of hot material
  • Material in short supply seckilling
model brand Quote
TL431ACLPR Texas Instruments
CDZVT2R20B ROHM Semiconductor
MC33074DR2G onsemi
BD71847AMWV-E2 ROHM Semiconductor
RB751G-40T2R ROHM Semiconductor
model brand To snap up
IPZ40N04S5L4R8ATMA1 Infineon Technologies
TPS63050YFFR Texas Instruments
BP3621 ROHM Semiconductor
ESR03EZPJ151 ROHM Semiconductor
BU33JA2MNVX-CTL ROHM Semiconductor
STM32F429IGT6 STMicroelectronics
Hot labels
ROHM
IC
Averlogic
Intel
Samsung
IoT
AI
Sensor
Chip
About us

Qr code of ameya360 official account

Identify TWO-DIMENSIONAL code, you can pay attention to

AMEYA360 weixin Service Account AMEYA360 weixin Service Account
AMEYA360 mall (www.ameya360.com) was launched in 2011. Now there are more than 3,500 high-quality suppliers, including 6 million product model data, and more than 1 million component stocks for purchase. Products cover MCU+ memory + power chip +IGBT+MOS tube + op amp + RF Bluetooth + sensor + resistor capacitance inductor + connector and other fields. main business of platform covers spot sales of electronic components, BOM distribution and product supporting materials, providing one-stop purchasing and sales services for our customers.

Please enter the verification code in the image below:

verification code