Architecture Shift
Important
High
85% Confidence
英特尔与SambaNova联合发布面向Agentic AI的异构推理架构
内容摘要
英特尔与SambaNova宣布合作,为Agentic AI生产负载设计异构计算蓝图。该方案结合GPU、SambaNova RDU和英特尔至强6处理器,旨在解决性能、效率与软件兼容性挑战,预计2026年下半年推出。
核心要点
英特尔与SambaNova签署协议,共同设计针对Agentic AI推理工作负载的架构。该架构旨在解决纯GPU推理架构的局限性。
具体设计为:使用GPU处理“预填充”(prefill)阶段,SambaNova的RDU(可重构数据流单元)处理高吞吐量的“解码”(decode)阶段,而英特尔至强6处理器作为主机和动作CPU。该异构方案强调维持与x86软件生态的兼容性,这是现代数据中心的基础。
英特尔高管强调,未来工作负载需要异构计算组合,此合作旨在提供一个面向大规模部署、兼具成本效益和高性能的推理架构。
具体设计为:使用GPU处理“预填充”(prefill)阶段,SambaNova的RDU(可重构数据流单元)处理高吞吐量的“解码”(decode)阶段,而英特尔至强6处理器作为主机和动作CPU。该异构方案强调维持与x86软件生态的兼容性,这是现代数据中心的基础。
英特尔高管强调,未来工作负载需要异构计算组合,此合作旨在提供一个面向大规模部署、兼具成本效益和高性能的推理架构。
重要性说明
这标志着AI推理基础设施正从单一加速器向精细化异构计算演进。英特尔通过将x86 CPU重新定位为AI Agent的“主机与动作核心”,试图在由GPU主导的AI硬件生态中,巩固其作为基础控制与协调层的战略地位。...