Intel 2026-06-02
Vendor Strategy 影响: Major 置信: 75%

英特尔联手SambaNova推机架级AI,CPU重夺推理控制权

内容摘要

英特尔在Computex 2026发布机架级AI基础设施,结合至强6+处理器与SambaNova SN-50 RDU,并推出解耦推理云服务Vector Core Compute,由至强6+编排、Blackwell GPU预填充、SN40 RDU解码。此举旨在以CPU为中心应对Agentic AI推理需求,挑战NVIDIA的GPU主导地位。

核心要点

英特尔在Computex 2026宣布多项AI创新,核心是推出基于至强6+处理器(Intel 18A制程,288核)和SambaNova SN-50 RDU的机架级AI基础设施,由富士康提供系统集成。该方案专为推理和智能体工作负载设计,强调CPU在Agentic AI中的主导地位,声称推理场景下CPU:GPU配比接近1:1。

同时,Vector Core Compute云服务展示完全解耦推理:至强6+负责编排与执行,NVIDIA Blackwell GPU负责预填充,SambaNova SN40 RDU负责解码。Together.ai在MiniMax 2.5模型上声称实现最快企业级推理。此外,英特尔宣布与西门子、日立等合作开发行业垂直解决方案,并推出第三代酷睿Ultra处理器。

重要性说明

英特尔此举表面上是为了优化推理成本效率,本质上是在防御和合围NVIDIA的GPU推理生态。通过将CPU重新定位为推理编排的核心,并引入SambaNova RDU作为专用加速器,英特尔试图将控制点从GPU计算平面转移到CPU控制平面,从而削弱NVIDIA在数据中心的话语权。

然而,该架构存在隐性锁定风险:一旦企业采用机架级方案,其推理工作流将深度绑定至至强6+SambaNova RDU的专有编程模型与互连,导致跨供应商迁移成本极高。同时,英特尔刻意淡化了RDU的生态成熟度——SambaNova的软件栈远不如CUDA丰富,企业将面临工具链匮乏和人才短缺的困境。

此外,解耦推理方案中预填充使用Blackwell GPU,解码使用RDU,这种异构组合增加了系统集成复杂度尾部延迟不确定性,而英特尔未提供任何端到端延迟基准测试数据。至强6+在100kW功耗下提供36864个核心,但实际推理吞吐量可能远低于同等功耗的GPU集群,尤其在需要高内存带宽的大模型场景中,DDR5带宽瓶颈可能成为性能短板。

PRO 决策建议

【厂商】竞争对手(如AMD、NVIDIA、Arm服务器厂商)应立即利用英特尔方案的短板:攻击其RDU生态封闭性编程模型复杂度,推广自家标准化的推理方案(如AMD的ROCm+MI300、NVIDIA的TensorRT-LLM),强调CUDA/ROCm的开发者生态和可移植性。同时,向客户展示在同等功耗下,纯GPU集群在大模型推理吞吐量上的优势,揭露至强6+的DDR5带宽瓶颈

【企业】CIO和架构师应对英特尔机架级AI方案进行严格的零信任技术审计:要求提供端到端延迟、吞吐量、功耗的独立基准测试(如MLPerf),并评估跨云可移植性——如果未来需要迁移至其他平台,现有基于RDU的推理代码能否轻松适配?建议优先考虑基于标准加速器(如NVIDIA、AMD GPU)或开源推理引擎(如vLLM)的方案,以避免供应商集中度风险

【投资者】资本市场应看穿英特尔此公关辞令:虽然合作阵容看似强大(富士康、Vista Equity),但核心硬件SambaNova RDU的市场份额极小,且其可重构数据流架构尚未获得广泛验证。英特尔的战略转向CPU推理是防御性动作,而非颠覆性创新。投资者应关注英特尔实际出货量和客户采纳率,而非新闻稿中的性能声明。

来源: 英特尔新闻室
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)