I
Intel
2026-06-06
Architecture Shift 影响: Major 置信: 89%

Intel发布解耦推理架构与至强6+,联合SambaNova富士康构建机架级AI基础设施

内容摘要

Intel在Computex 2026发布三项核心成果:1)与SambaNova、富士康共建机架级AI基础设施,已量产;2)全球首个全解耦推理系统公开演示——Xeon 6编排+SN40 RDU解码+NVIDIA Blackwell GPU预填充,Together.ai运行MiniMax 2.5达最快企业级推理速度;3)Xeon 6+——首款18A制程数据中心CPU,单机架32U空间36864核心@约100kW。Agent推理时代CPU:GPU配比从1:4向1:1演变。

核心要点

本次Computex 2026,Intel发布的不是简单产品更新,而是一套完整的"Agent推理时代CPU复兴"战略叙事。

一、解耦推理架构

Vector Core Compute(Vista Equity Partners + Cambium Capital组建)推出全球首个公开的全解耦推理系统:编排执行层由Intel Xeon 6负责请求路由与负载均衡;解码层用SambaNova SN40 RDU优化token生成的内存带宽操作;预填充层由NVIDIA Blackwell GPU处理初始prompt矩阵运算。首个商业客户Together.ai运行MiniMax M2.7模型,经Artificial Analysis测试确认为当前最快企业级推理速度。Vista将覆盖90余家投资企业,服务超250万企业用户和7.5亿终端用户。

二、Intel Xeon 6+处理器

首款采用Intel 18A工艺的数据中心CPU,定位云原生、智能体AI和网络密集型负载。液冷机架32U空间内提供36864个核心,功耗约100kW/机架,针对每核心吞吐量和延迟可预测性优化。Creative Strategies CEO Ben Bajarin指出:训练时代CPU:GPU配比约1:4,Agent推理时代该比例将变为1:1甚至更低——CPU在数据中心的地位重新上升。

三、机架级AI基础设施(SambaNova + 富士康)

组合至强处理器与SambaNova SN-50 RDUs,富士康提供量产级系统集成,已具备量产条件并展出实物。富士康还将推出CPU密集型轻量版本,适配无需加速器的推理/混合AI负载场景。

重要性说明

【防守与合围对象】表面是展示新一代数据中心产品,实质是针对"Agent推理时代CPU地位回归"的防御性布局——也是对NVIDIA双端挤压的反制。NVIDIA刚发RTX Spark抢占PC入口、Vera Rubin巩固数据中心GPU主导权;Intel的解耦推理证明即使NVIDIA占绝对优势,CPU仍可在编排层找到不可替代位置。

【隐性资产锁定】解耦推理将LLM拆分为prefill(GPU密集)和解码(内存带宽密集,适合RDU)。Intel通过至强6+控制编排层,所有推理请求路由/调度/负载均衡都经Intel CPU——把CPU重新定位为数据中心"交通指挥官"。企业客户一旦基于此架构部署,迁移到全GPU方案成本极高。

【隐瞒限制】跨组件通信延迟未公布实际数字,理论上组件间通信可能成新瓶颈;18A制程良率/量产时间表未明确(此前Intel 4/3节点曾延期);与Blackwell GPU共存需NVIDIA配合,竞合关系长期稳定性存疑;单机架100kW对现有数据中心散热改造成本未讨论。

PRO 决策建议

【厂商】NVIDIA应密切监控Intel解耦推理商业化进展——当前仍依赖Blackwell做预填充短期利好GPU出货,但"CPU编排+专用加速器"模式若大规模验证成功将侵蚀全栈方案溢价空间。建议强化NIM推理栈一体化优势提高切换成本。

【企业】评估推理基础设施的架构师获得重要替代选项——尤其对已有大量x86资产、希望渐进式而非一次性替换为全GPU方案的组织。建议申请Vector Core Compute早期访问进行POC,重点关注跨组件延迟是否满足SLA、混合架构运维复杂度增量、TCO对比纯GPU实际节省比例。

【投资者】Intel方向正确但执行风险极高——关键指标:Xeon 6+ 18A量产时间表和初期良率、SN50 RDU市场接受度、富士康首批大客户订单量。如至强6+如期交付且解耦性能持续领先,12-18个月内或重获数据中心定价话语权。

来源: Intel Newsroom / 财联社 / TechWire Asia
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)