存储器如何影响人工智能发展？-Ameya360电子元器件采购网

存储器如何影响人工智能发展？

发布时间：2019-03-28 00:00

作者：

来源：互联网

阅读量：2069

选择存储器并将它们构建到系统中变得更加困难。

边缘计算性能的提升给存储器的设计，类型的选择和配置都带来挑战，这也导致在不同的应用市场中需要进行更复杂的权衡。

芯片架构正在与新市场一起发展，但数据在芯片、设备之间以及系统之间如何移动并不总是很清楚。汽车和AI应用的数据正变得越来越多和复杂，但芯片架构在处理时有时不清楚如何优先处理数据。这让芯片设计人员面临抉择，是选择共用内存降低成本，还是增加不同类型内存提高性能和降低功耗。

所有这些都是以安全为前提，并且不同的市场设计的要求也不一样。比如，汽车中的各种类型的图像传感器（如激光雷达和摄像头）的大量数据需要在本地处理。AI芯片则希望性能能够提升100倍。

解决内存问题有一些方法，其中一种是片上存储器，也就是将存储器分散地集成在运算单元旁，最大程度减少数据搬移，这种方法的目标是通过减少负载和存储的数量来突破内存瓶颈，也能降低功耗。

“存算一体（In－memory computing）可能是模拟的、数字的，或两者都有。” Cadence Digital＆Signoff Group的高级首席产品经理Dave Pursley说，“虽然在内存中进行计算的想法可能是日益增长的趋势，但在这种计算中实际发生的情况似乎大不相同。”

SRAM和DRAM仍是主流

尽管市场出现了新的变化，但片上SRAM和片外DRAM仍是主流。已经有专家预测DRAM多年后将“死亡”，但它仍然是最经济和可靠的选择。DRAM具有高密度、架构简单、低延迟和高性能的特性，兼具耐用和低功耗的特性。

DRAM密度的增速正在放缓，但HBM2等新架构允许通过堆叠模块的方式而不是使用DIMM来垂直增加密度，这种方法还让DRAM更靠近处理单元。

另外，SRAM价格昂贵且密度有限，但其高速性能多年来已被验证。片上存储器的挑战是采用分布还是共用的方式，在某些情况下，为保证安全性需要增加冗余。

“所有这些要求都会影响存储器的类型和数量的选择，还涉及片上和片外存储器之间的权衡，以及访问每个存储器互连的复杂性。”Arm高级物联网架构师Ryan Lim表示。

低功耗存储器是关键

存储器的一个关键问题是功耗，其中存储器类型和配置等多种因素都会影响功耗。例如，在7nm的存储器中进行数据的存取可能消耗更多功耗，这是因为线路中的RC延迟。当然，这也会产生热量，有可能会破坏输入输出存储器的信号的完整性。

不过，较慢的片外数据使用高带宽内存可以节省功耗，并且可以与高速GDDR6一样快。如何做出这些决定取决有多种因素，包括设备的平均售价和选择的存储器类型。

还有针对手持移动设备的极低功耗的存储器，包括越来越多使用电池的边缘设备。

“这些存储器具有极高的效能，可在一定程度上提升电池供电设备的功耗和数据速率。” Rambus杰出的院士Steven Woo说。“它们也可以在多种模式下工作，当处于待机状态时，可以消耗很少的能量满足手机和平板电脑等产品的需求，并在需要进行处理时快速切换到更高性能／更高功率的模式。 ”

低功耗存储器还支持多种封装方式，允许它们与手机处理器堆叠在一起，满足智能手机的轻薄需求，也能集成在PCB上支持平板电脑和其他消费类设备高容量内存配置的需求。

毫无疑问，开发低功耗存储器是一项挑战。“当设计低功耗存储器时，它们支持的速率范围很广，相对低功耗存储器而言，这些数据速率往往是相当高的。”Woo说。“这通常是由一两个主要应用市场驱动，所以它必须面向一个市场很大的行业，拥有足够大市场的行业才能催生新的存储器。从历史上看，手机市场是成功的例子。如果与不同的手机制造商交谈，他们都希望获得性能和电源效率更高的存储器，因为他们希望能够延长电池寿命。对于其他想要使用低功耗存储器的公司，他们会很庆幸其他人正在帮他们实现。“

通常，这些合格的存储器可能在几种不同的数据速率下运行，但速率很接近。“这些存储器可能有一个是每秒4．2千兆比特的速率，另一个是3．2千兆比特。”他解释道，“这可以让内存制造商在生产所有这些存储器时，进行所谓的分级。当某些部件没有全速运行时会发生这种情况，但制造商依旧会出售这些内存，因为有些客户需要以更便宜的价格购买性能较低的存储器。Binning（数据合并）允许这种情况。这些产品的性能在一定的范围内，都属于合格品。“

存储器如何影响人工智能发展？

人工智能在几乎所有新技术中都扮演着重要角色，而存储器又在人工智能中起着重要作用。极高的速度和极低的功率是芯片一直以来追求的，不过这并不总是有效，因为空间有限。但它能解释为什么数据中心和用于训练的AI芯片比应用于终端推理设备的芯片更大。另一种方法是减少一些片外存储芯片，以提高数据吞吐量并通过设计减少到内存的距离，或者限制片外数据流。

在任何一种情况下，片外存储器的竞争很大程度上归结为DRAM－GDDR和HBM。

“从工程和生产的角度来看，GDDR看起来很像其他类型的DRAMs，如DDR和LPDDR，”Woo说。“你可以将它集成到标准PCB板上，还能用类似的制造工艺。HBM是新一些的技术，它涉及堆叠和内插器（interposers），因为HBM有许多连接速度较慢。每个HBM堆栈将具有一千个连接，因此需要高密度的互连，这远远超过PCB的处理能力。这就是为什么有些公司正在使用内插器，因为可以将这些导线蚀刻得非常接近，很像片上连接，可以获得更多的连接。“

HBM追求最高性能和最佳功效，但成本更高，需要更多的工程时间和技术。使用GDDR，DRAM和处理器之间的互连就没那么多，但它们的运行速度要快得多，这会影响信号完整性。

PPA

功率，性能和面积（Power、Performance、Area）仍然是关键驱动因素，尽管有架构和变革和新技术。

“这三个都非常重要，但很大程度上取决于应用。”西门子Mentor知识产权部门总经理Farzad Zarrinfar表示。“例如，如果是一个便携应用，功耗非常重要。电源本身也分动态和静态。一部分是动态功率，一部是静态功率。如果应用于无线通信，如果有大量计算，动态功率非常重要。但是，如果是可穿戴式应用，使用者会处于睡觉、醒来运动，然后又回到睡眠的不同状态，静态／泄漏功率非常重要。“

浅睡眠等功能使设计人员能够大幅减少泄漏，这时，不工作的存储器进入源偏置模式以减少泄漏，而其他被直接访问的存储组是工作的。在设计的深度睡眠时，可以通过电源管理，管理Vdd和最小化泄漏的技术来保留数据。如果不需要保留数据，则用关闭模式能进一步减少泄漏。

与电源效率相关的一切在汽车中也是至关重要的。“在电动汽车中，电池的寿命非常重要，因此耗电量至关重要，”Zarrinfar说。“人们希望从－40°C一直到125°C都具有线性的特性，甚至在更高的150°C情况下。他们不希望在高温下泄漏陡然增长，并且他们希望尽可能地将其保持在线性范围内。同样，我们必须在整个温度范围内注意功耗和泄漏，这非常重要。“

无论应用领域如何，功率仍然是首要考虑因素。“我们看到随着SoC设计向更小化发展。”他说。“存储器的消耗正在增加，嵌入式存储器的容量也在增加。现在，我们看到超过50％的裸片是存储器。所以人们必须注意存储器的耗电量。“

结论

尽管有大量革命性技术和创新架构，但内存仍然是设计的核心。虽然即将出现新的存储器类型，例如相变和自旋扭矩，但大部分仍然应用于各种条件的市场。最大的变化在于如何对现有存储器进行优先级划分、共用、在设计中选择，以及最终如何使用它们。虽然这听起来像是一个简单的问题，但事实并非如此。

“选择正确的内存解决方案通常是获得最佳系统性能的最关键。” Synopsys高级技术营销经理Vadhiraj Sankaranarayanan 在最近发表的一份白皮书中指出，这说起来容易做起来难。

（备注：文章来源于网络，信息仅供参考，不代表本网站观点，如有侵权请联系删除！）

行业新闻

初学者必看:存储器基础知识汇总

　　RAM　　Random-Access-Memory,随机存储存储器，可读可写，分为SRAM和DRAM，即静态随机存储器和动态随机存储器，理解上静动态主要体现是否需要刷新，通常DRAM需要刷新，否则数据将丢失;SRAM的效率较好，而成本较高，通常将SRAM作为cache使用。　　PSRAM　　Pseudo static random access memory，伪SRAM伪随机存储器，内部和DRAM相似，接口和SRAM相似，具有自刷新功能，不需要外部刷新。而其成本介于SRAM与DRAM之间。　　单\双端口RAM　　单端口RAM同一时刻，只能满足读或写某一动作，而双端口RAM存在两套独立的地址、数据、读写控制等，可以同时进行两个操作，当然为避免冲突，存在一定的仲裁控制，成本也更高。伪双口RAM是只有两访问接口，单一个端口只读，另一个端口只能写。　　ROM　　Read-Only-Memory,只读存储器，通常使用时一次写好，使用时只能进行读操作，而不能进行写操作。　　CACHE　　高速缓冲存储器，由于存储器DDR/DRAM等相对于处理器访问速度较慢，增加的一级缓冲存储空间，当需要处理器需要访问内存某一块区域时，先缓存cache中，处理器访问cache速度较快;但同时也需要增加处理DDR和CACHE中数据同步、替换等问题。　　TCM　　Tightly-Coupled-Memory 紧密耦合(链接)的存储器，是指和处理器链接紧密,基本可以看做和CACHE同一等级连接的存储空间(印象中ARM结构上和L2 CACHE同一层次)，其存储空间的内容不会像CACHE处理一样经常替换。　　EEPROM　　Electrically Erasable Programmable read only memory电可擦可编程只读存储器，掉电非易失的存储芯片，在特殊高电压模式下可以插写，普通模式下只读ROM。　　FLASH　　闪存，和EEPROM一样可擦除可重写，差别EEPROM总是按字节操作，FLASH可以按照字节块擦除。FLASH有分Nand-Flash、Nor-Flash，Nor-flash可以按照字节读取，而NandFlash只能按块读取，两者同样可以按照字节块擦除。Nor-Flash需要支持随机读取的地址、数据线，成本比Nand-Flash高，而其可擦写次数低于NAND FLASH,一般嵌入系统中刚boot需要初始化的代码需要放置在Nor-Flash中。　　对于FLASH的读取总线可以有I2C、SPI串行型，也可以采用并行Parallel;同样Flash可以和处理器集成在一起或是通过总线外部访问。　　eMMC　　embedded multi media card，集成了NAND FLASH和控制部分的集成电路，提供像SD、TF(trans-flash)卡一样的使用接口。　　硬盘　　传统硬盘采用磁材料作为存储介质，固态硬盘使用FLASH，访问速度性能较好。

2024-03-20 11:23 阅读量：1619

型号	品牌	询价
RB751G-40T2R	ROHM Semiconductor
MC33074DR2G	onsemi
CDZVT2R20B	ROHM Semiconductor
TL431ACLPR	Texas Instruments
BD71847AMWV-E2	ROHM Semiconductor

型号

品牌

询价

ROHM Semiconductor

onsemi

ROHM Semiconductor

Texas Instruments

ROHM Semiconductor

型号	品牌	抢购
BU33JA2MNVX-CTL	ROHM Semiconductor
IPZ40N04S5L4R8ATMA1	Infineon Technologies
STM32F429IGT6	STMicroelectronics
TPS63050YFFR	Texas Instruments
BP3621	ROHM Semiconductor
ESR03EZPJ151	ROHM Semiconductor

型号

品牌

抢购

BU33JA2MNVX-CTL

ROHM Semiconductor

IPZ40N04S5L4R8ATMA1

Infineon Technologies

STM32F429IGT6

STMicroelectronics

TPS63050YFFR

Texas Instruments

BP3621