让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

HBM 4,3nm

发布日期:2024-12-04 10:02    点击次数:168

(原标题:HBM 4,3nm)

要是您但愿不错经常碰面,迎接标星保藏哦~

据韩媒KEDGLOBAL引述相关音信露出,SK海力士将接管现在发轫进的代工技巧3纳米工艺,在2025年卑劣分娩定制的HBM4芯片。

报说念指出,这家韩国芯片制造商原运筹帷幄在5纳米节点上为客户定制第六代高带宽工场(HBM4)。它正与代工教学者台积电(TSMC)互助设备HBM4。但最近,应主要客户对更先进工场的条件,SK海力士已转向3 纳米工艺分娩 HBM4,预测将于2025 年下半年向 Nvidia 公司供货。

音信东说念主士告诉《韩国经济日报》,SK海力士将于3月份推出非常多的在3纳米HBM芯片上的HBM4原型。Nvidia的图形处理单位(GPU)居品现在基于4纳米HBM芯片。借助台积电的CoWoS封装,基片位于联接到 GPU 的 HBM 底部,充任 GPU 的大脑。与接管 5 nm 基片的 HBM4 比较,堆叠在 3 nm 基片上的 HBM 预测性能将栽种 20-30%。

在华盛顿扫尾对华出口之际,SK海力士正全力干涉 Nvidia Corp.、Google LLC 和 Microsoft Corp. 等好意思国大型科技公司,以减少对中国的依赖,因此英特尔转向 3 nm 代工工艺。

SK 海力士占据大众 HBM 商场约一半的份额,并将其大部分 HBM 居品运往大众最大的 AI 芯片买家 Nvidia。使用 3 纳米基片分娩 HBM4 将进一步拉大其与三星电子的差距,后者运筹帷幄将其 4 纳米代工工艺应用于第六代 HBM(即 HBM4)。

HBM渐成主流

正如Alphawave Semi在一篇著述中所说,跟着 AI 模子的范畴和复杂性约束增长,它们会生成和处理越来越广泛的数据集,从而导致内存系统出现性能瓶颈。这些内存密集型操作会给内归档次结构带来压力,尤其是在考试大型神经汇聚等高朦拢量场景中。

咱们看到 CPU 处理才调约束栽种,撤职摩尔定律,但内存走访速率却莫得保抓相通的速率。专用 AI 硬件天然简略达成极高的并行性,但受到内存蔓延和带宽的扫尾。这种瓶颈频繁称为内存墙,会严重影响通盘系统的性能。为了搪塞这些挑战并削弱内存性能差距,东说念主们正在探索 3D 堆叠内存技巧等规模的特殊,频繁称为高带宽内存 (HBM)。

HBM 接管 3D 堆叠架构,其中内存芯片垂直堆叠并通过硅通孔 (TSV) 互连。堆叠的 DRAM 通过中介层联接到处理器芯片。这减少了数据必须传输的物理距离,并允许更高的数据传输速率和更低的蔓延。

总体而言,HBM领有以下几点上风:

高带宽–使用宽内存接口总线可为芯片之间的数据传输提供多数带宽。这关于并行处理责任负载(举例 AI 模子考试和深度学习中的责任负载)终点灵验。

更小的外形尺寸–与传统内存成立比较,HBM 的 3D 堆叠想象占用空间更小。这些堆叠随后装配在处理器傍边的硅或有机中介层上,从而酿成高度紧凑的内存系统。

低功耗–HBM 的想象功耗也低于传统内存,尤其是在提供高带宽时。低功耗是当代筹画硬件想象的一个重要身分,终点是关于频繁大范畴部署的 AI 系统而言。

遏抑蔓延–与 DDR 和 GDDR 等片外内存责罚有运筹帷幄比较,HBM 可提供更低的蔓延。凭借最近对 2.5D 中介层和 3D 堆叠等先进封装技巧的投资,它可达成更紧凑的 SoC 想象,得当异构筹画。

关于性能和带宽至关热切的应用,HBM 具有显赫上风,尽管老本高、复杂度高,但它仍然是最可行的责罚有运筹帷幄之一。跟着筹画责任量因东说念主工智能和大数据的爆炸式增长而约束演变,照顾和走访内存的新才调关于克服内存瓶颈至关热切。

而跟着东说念主工智能的复杂性约束增多,HBM 在开释下一代东说念主工智能硬件的一都后劲方面的作用将变得越来越热切。跟着演变,下一代 HBM4 和 HBM4E 技巧将通过将接口宽度加倍至 2048 位来进一步得志 AI 责任负载的需求。

然而,随之而来的挑战,亦然不问可知的。

HBM实施挑战

因为达成具有高带宽内存 (HBM) 的 2.5D 系统级封装 (SiP) 是一个复杂的经由,触及架构界说、想象高可靠性中介层通说念以及对通盘数据旅途进行谨慎测试(包括系统级考证)。

总体而言,HBM领有几方面的挑战:

制造复杂性– HBM 接管 3D 堆叠架构构建,制造 TSV 和对都多层内存芯片所需的精度远高于传统内存。此外,HBM 频繁装配在硅中介层或有机中介层上,这为内存堆栈和处理器之间提供高速通讯。这需要先进的光刻技巧和精准的芯片摈弃,这增多了制造的全体复杂性。

热照顾– 由于 HBM 的堆叠特色,多个 DRAM 芯片互相叠放,内存芯片产生的热量会蓄积在堆叠中。这带来了巨大的热挑战。频繁需要使用液体冷却、热界面材料 (TIM) 和集成散热器等先进冷却才调来缓解热节流。

总领有老本– 由于 2.5D 中介层和 3D 堆叠技巧需要先进的制造技巧,达成高产量可能相配具有挑战性。即使任何堆叠芯片或互连中出现一个颓势,也可能导致通盘 HBM 堆叠失效,从而遏抑全体制造产量并增多老本。

在具体达成经由中,则需要堤防以下几方面的问题:

最初,在高等想象与架构筹画时,要细目必要的带宽、蔓延和功率条件关于筹画全体系统架构相配热切。单片芯片还不错剖释为更小的专用模块(称为chiplet),以处理系统内的特定功能。这种才调不错提供增强的想象天真性、功率后果、产量和全体可推广性。

来到中介层想象的时候,由于中介层不错是硅材料或有机材料,并复古多个金属层以处理 HBM 堆栈和筹画芯片之间的高密度布线。值得一提的是,因为HBM4 将以 HBM3E 中的校正为基础,旨在进一步栽种数据速率、能效和内存密度。由于接口宽度增多了一倍(至 2048 位),但 HBM4 内存shoreline 与 HBM3E 保抓不变,因此主要挑战是怎样照顾 PHY 和中介层中更密集的 I/O 布线。布局应确保仔细的信号布线、电源分派和接地,以最大限定地减少通过通说念的串扰和损耗,从而得志 HBM4E 表率。

去到SI和PI分析时,为了预防 HBM4E 数据速率下的信号衰减,咱们需要奉行阻抗匹配、屏蔽等技巧,并选择设施确保相邻走线之间的串扰最小。中介层的特征包括插入损耗 (IL)、反射损耗 (RL)、功率总串扰 (PSXT) 和插入损耗与串扰比 (ICR),以表征通说念并确保咱们得志下一代 HBM4E 技巧的条件。

此外,供电汇聚也需要仔细筹画,以细目去耦电容、低阻抗旅途和重要敏锐信号的专用电源层。在细目供电汇聚的蓄意阻抗时,需要研讨主板、封装、中介层和硅片等所有组件的噪声孝顺。

临了,往常的 SI-PI 测试可确保 HBM 封装稳当抖动和功率规格。将中介层引起的抖动剖释为 ISI、串扰和高潮-下落时刻退化有助于识别影响 EYE 闭合的主要通说念参数,并有助于更好的布局和 I/O 架构优化。

对数据旅途中的所有组件进行系统级测试关于确保拼装好的封装得志想象阶段限定的性能规格至关热切。包括复古 DFT 的想象在内的玄虚测试套件关于达成高产量的早期会诊也至关热切。

自界说的HBM

在曩昔,咱们谈的HBM都是通用的HBM,但从HBM 4运转,则以客制化为主流。在AI 依然冲破了筹画系统极限确当下,HBM 的自界说达成允许与筹画芯片和自界说逻辑进行更好的集成,因此不错成为阐发其复杂性合理的性能互异化身分。

全体看来,定制 HBM 集成具有以下几点上风:

1

更好地谐和驰念与需求

定制 HBM4 想象意味着优化内存和内存限度器,使其与处理器或 AI 加速器的特定需求精致结合。这可能触及调理内存成立(举例,通过增多带宽、减少蔓延或添加更多内存层)并微调芯片迤逦口以确保顺畅快速的通讯。

2

2.5D集成

在 2.5D 封装中,处理器芯片和 HBM 定制芯片比肩摈弃在中介层上,中介层充任它们之间的高速通讯桥梁。这种才调允许使用宽数据总线和短互连,从而达成更高的带宽和更低的蔓延。

3

芯片迤逦口栽种了带宽

芯片迤逦口不错复古高时钟速率的超宽数据总线,从而达成巨大的带宽朦拢量。

4

它还不错改善蔓延

通过镌汰内存和处理器之间的距离,芯片到芯片接口不错最大限定地减少走访外部内存带来的蔓延。这在 AI 模子考试和推理中至关热切,因为蔓延会严重影响性能。

5

电源后果

更短的互连距离和对外部内存限度器需求的减少遏抑了功耗。这关于运行高功耗 AI 责任负载的数据中心以及对电源后果至关热切的角落 AI 设备来说是一个重要上风。

总体而言,当与芯片到芯片接口结合使用时,定制 HBM 可提供鉴定的责罚有运筹帷幄,匡助责罚 AI 芯单方面对的内存瓶颈问题。通过运用 2.5D 和 3D 堆叠等先进封装技巧,AI 芯片不错达成超高内存带宽、更低蔓延和更高能效。这关于处理应代 AI 责任负载的海量数据需求至关热切,终点是在深度学习、及时推理和高性能筹画等应用中。天然在老本和热照顾方面存在挑战,但性能上风使这种才调关于下一代 AI 硬件系统相配有价值。

而使用诸如 UCIe 圭臬 (Universal Chiplet Interconnect Express) 之类的芯片到芯片接口则是创建自界说 HBM 的一种顶端才调,该有运筹帷幄触及将内存芯片与筹画芯片精致集成,以达成极高的带宽以及组件之间的低蔓延。在这种达成中,内存限度器通过内存基座芯片上的硅通孔 (TSV) PHY 径直与 HBM DRAM 接口联接。来自主机或筹画机的高歌通过使用流式公约的芯片到芯片接口进行转念。这允许重用主芯片上已占用的芯片到芯片海岸线,用于中枢到中枢或中枢到 I/O 联接。这种达成需要 IP 供应商、DRAM 供应商和最终客户之间的密切互助,以创建自界说内存基座芯片。

但要达成这个,需要产业链的圆善结合。

HBM 4的定制化依然在产业链达成共鸣。但依然还有通过HBM 4的需求。

kedgloabal在报说念中示意,关于通用的 HBM4 和 HBM4E,SK 海力士将与台积电互助接管 12 纳米工艺技巧。这家大众第二大内存芯片制造商使用其基础芯片制造了 HBM3E,即第五代 HBM。但关于 HBM4 芯片,它已决定接管台积电的技巧。

应 Nvidia 的条件,SK 海力士正在加速 HBM4 芯片的设备。

Nvidia 首席奉行官黄仁勋最近条件 SK 集团董事长崔泰源将 12 层 HBM4 芯片的供应从 SK 的 2026 岁首的运筹帷幄提前六个月,崔泰源上个月在 SK AI 峰会 2024 上发表主题演讲时示意。

与此同期,韩国半导体行业音信东说念主士上个月告诉《韩国经济日报》,特斯拉公司已条件三星和 SK 海力士提供用于通用的 HBM4 原型样品。在测试原型后,这家大众第一大电动汽车制造商预测将采纳这两家公司中的一家算作其 HBM4 供应商。

至于他们韩国脉土的另一个竞争敌手三星。早前音信娇傲,三星电子现在正在设备HBM4,以提供给微软和Meta。报说念指出,三星将以4nm量产HBM4,抵御SK海力士/台积电定约。

https://www.kedglobal.com/korean-chipmakers/newsView/ked202412030008

https://www.design-reuse.com/industryexpertblogs/57123/redefining-xpu-memory-for-ai-data-centers-through-custom-hbm4-part-3.html

半导体极品公众号推选

专注半导体规模更多原创实质

存眷大众半导体产业动向与趋势

*免责声明:本文由作家原创。著述实质系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或复古,要是有任何异议,迎接考虑半导体行业不雅察。

今天是《半导体行业不雅察》为您共享的第3966期实质,迎接存眷。

『半导体第一垂直媒体』

及时 专科 原创 深度

公众号ID:icbank

可爱咱们的实质就点“在看”共享给小伙伴哦