Product Launch 影响: Major 置信: 95%

SK海力士HBM4E送样:3nm逻辑+384GB单GPU,引爆AI内存带宽军备竞赛

内容摘要

SK海力士向主要客户发出12层HBM4E样品,采用TSMC 3nm逻辑裸芯,单引脚带宽显著提升,目标平台为NVIDIA Rubin Ultra,每GPU容量达384GB。此举标志着与三星在下一代AI存储赛道正式进入抢跑阶段,HBM BOM占比已飙升至65-70%。

核心要点

SK海力士HBM4E的核心技术突破在于其逻辑裸芯采用TSMC 3nm工艺,相比三星的4nm基础裸芯,这可能在能效和信号完整性上提供优势。单引脚带宽提升的具体数值未披露,但目标平台NVIDIA Rubin Ultra暗示其将支持12-Hi堆叠,实现384GB/GPU的容量,是当前HBM3E(如H100的80GB)的4.8倍。

三星于5月底率先送样HBM4E,规格为1c DRAM+4nm基础裸芯,带宽达4TB/s,单栈容量48GB。两者均瞄准AI大模型从千亿到万亿参数的演进,解决内存墙问题。HBM市场的商业价值重塑了AI服务器的成本结构,内存BOM占比从传统服务器的约30%飙升至65-70%,使存储厂商在AI供应链中的议价能力空前增强。

重要性说明

表面上这是内存带宽的线性升级,实质上是英伟达通过锁定HBM4E规格进一步巩固其生态壁垒。SK海力士和三星的HBM4E均针对NVIDIA Rubin Ultra进行优化,这意味着英伟达的GPU架构与特定HBM供应商的3nm/4nm逻辑工艺深度绑定。企业若选择Rubin Ultra,其内存供应链将被锁定在SK海力士或三星的特定工艺节点上,丧失了跨代升级或切换至AMD/Intel GPU时的内存兼容性。

被刻意淡化的物理限制在于HBM4E的功耗和散热挑战。384GB/GPU的高容量必然带来更高的功耗密度,而3nm逻辑裸芯虽然能效提升,但HBM堆叠本身的散热瓶颈(如热界面材料TIM1的导热极限)并未解决。在800W+的GPU功耗环境下,HBM4E的尾部延迟热串扰可能成为新的性能瓶颈,尤其在长时间大规模训练任务中。此外,内存BOM占比65-70%意味着AI服务器的成本控制权已从GPU转向存储厂商,企业采购时需警惕供应商集中度风险——一旦HBM供应短缺,整个AI集群的交付将直接瘫痪。

PRO 决策建议

【厂商:三星、美光】应加速开发与AMD MI400Intel Falcon Shores平台兼容的HBM4E方案,打破英伟达的HBM-GPU深度绑定。同时,三星需利用其4nm工艺在成本上压制SK海力士的3nm方案,并推出开放HBM互连标准(如OCP HBM),降低企业切换GPU平台的迁移成本。
【企业:CIO与架构师】立即启动HBM供应商多元化审计:在采购Nvidia Rubin Ultra时,要求合同明确支持多HBM供应商切换(如SK海力士与三星的混合供货)。评估HBM4E的散热TDP对现有液冷基础设施的冲击,避免因热串扰导致训练任务中断。建立内存BOM占比监控模型,将HBM价格波动纳入AI TCO计算,对冲供应商集中度风险。
【投资者:资本市场】看穿HBM4E的技术营销光环:虽然带宽提升,但3nm逻辑裸芯的成本将侵蚀SK海力士的毛利率。关注三星的4nm方案在成本效率上的优势。警惕英伟达通过HBM-GPU绑定进一步控制AI生态,这可能导致监管审查。长期看,CXL互联内存等替代技术可能削弱HBM的独占性。

来源: 市场资讯
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)