A
AMD
2026-06-15
Vendor Strategy 影响: Important 置信: 75%

AMD收购MEXT:用AI预测让Flash逼近DRAM,降低AI内存TCO

内容摘要

AMD宣布收购AI内存优化初创公司MEXT,其核心技术利用AI预测模型使NAND Flash在延迟和吞吐量上逼近DRAM,旨在扩展AI服务器的有效内存容量,降低总拥有成本(TCO)。该技术将被整合进AMD数据中心全线产品,包括EPYC CPU和Instinct GPU,以应对大模型对内存的饥渴。

核心要点

AMD于2026年6月15日宣布收购MEXT,一家专注于AI驱动内存优化的初创公司。MEXT的核心技术是AI-powered predictive memory,利用机器学习模型预测数据访问模式,从而让NAND Flash在延迟和吞吐量上模拟DRAM行为。这直接回应了现代AI模型、数据分析、虚拟化和HPC工作负载对内存容量的爆炸性需求。

AMD声称,通过整合MEXT技术,客户可以在不牺牲性能的前提下大幅扩展有效内存容量,降低基础设施成本并提高资源利用率。该技术将融入AMD整个数据中心产品线,包括EPYC CPUInstinct GPU以及Pensando DPU等平台。AMD强调这是其“full-stack compute and AI solutions”战略的一部分。

值得注意的是,MEXT团队拥有深厚的内存系统和AI基础设施专业知识,其创新将帮助AMD解决现代数据中心建设中“最重要的挑战之一”。AMD并未披露具体的性能指标(如延迟改善百分比、容量扩展倍数),但暗示该技术可显著降低AI部署的TCO并加速部署时间。

重要性说明

AMD收购MEXT表面是技术升级,本质上是在防守NVIDIA的HBM内存霸权。NVIDIA凭借HBM的高带宽在AI训练中占据统治地位,AMD通过让Flash逼近DRAM,试图在推理和内存容量敏感场景中建立成本优势。但该架构故意隐瞒了Flash的物理限制:NAND Flash的写入耐久度有限(典型3D NAND约1000-3000 P/E cycles),AI推理的反复模型加载和更新会快速磨损Flash,导致隐性替换成本。

此外,预测模型的尾部延迟(Tail Latency) 是致命短板。AI预测不可能100%准确,一旦cache miss,访问Flash的延迟(~100μs)远高于DRAM(~100ns),造成1000倍惩罚,这对实时推理(如自动驾驶、金融交易)不可接受。AMD通过集成到自家平台(EPYC+Instinct) 来锁定用户,用户一旦采用MEXT优化,将被迫使用AMD全套硬件,无法在异构环境中灵活切换NVIDIA GPU。

该技术对训练场景几乎无效——训练需要频繁随机写入梯度,Flash的写放大和磨损会迅速消耗寿命。AMD的公关刻意模糊了训练与推理的适用边界,企业买家若在训练集群部署,将面临性能与可靠性的双重陷阱。

PRO 决策建议

【厂商(竞争对手)】Intel和NVIDIA应立即发布独立基准测试,对比MEXT优化后的Flash推理与标准DRAM推理的尾部延迟分布耐久度衰减曲线。Intel可强调其CXL内存池化方案提供更透明、无磨损的内存扩展,无需AI预测带来的不确定性。NVIDIA应联合Pure Storage等Flash厂商,推出NVMe over Fabrics + GPU Direct Storage方案,证明直接访问Flash比AI预测更可靠。

【企业(CIO与架构师)】企业必须要求AMD提供MEXT技术的详细耐久度模型和尾部延迟SLA,并在非生产环境进行至少6个月的长期压力测试,重点监控Flash磨损速率和预测miss率。避免在训练集群或对延迟敏感的推理场景中采用,仅考虑在批量离线推理或内存容量极度受限的场合试点。保留跨平台灵活性,确保MEXT优化不绑定至AMD独家硬件,要求支持开放标准(如CXL、OpenCAPI)。

【投资者】此收购是AMD在AI基础设施领域追赶NVIDIA的低成本差异化策略,但技术成熟度存疑。关注MEXT技术能否在2027年前实现量产并展示可复现的50%以上TCO降低同时保持99.9%预测命中率。若NVIDIA推出类似Flash优化方案(如Grace Hopper的NVLink-C2C内存池化),AMD的差异化窗口将迅速关闭。短期谨慎乐观,长期警惕NVIDIA的反制。

来源: blog
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)