情报
AI 生成的结构化厂商动态简报
英特尔Computex 2026:以CPU编排Agentic AI,x86重夺推理控制权
英特尔在Computex 2026发布基于18A制程的288核至强6+处理器与第三代酷睿Ultra,强调Agentic AI工作负载使CPU:GPU配比从1:8跃升至1:1,并联合SambaNova、富士康推出机架级推理系统,试图将CPU重新定义为AI推理的编排核心。
谷歌Trillium TPU:4.7倍训练性能提升背后的算力锁定与生态陷阱
谷歌云发布第六代TPU Trillium,采用3纳米工艺,AI训练性能提升4.7倍,推理性能提升2.5倍,能效比H100高2倍。但Trillium仅限Google Cloud TPU v6p实例,深度绑定AI Hypercomputer架构,形成从芯片到网络的全栈锁定。
英伟达Blackwell Ultra与Omniverse:AI工厂生态锁定,工业数字孪生标准之争
NVIDIA发布Blackwell Ultra架构,推理性能提升4倍,推出DGX B200系统。与富士康合作建设全球最大AI工厂(2027年投产)。Omniverse平台已有700+客户,成为工业数字孪生标准,旨在重塑全球计算架构为AI工厂。
Fortinet联手NVIDIA推出FortiAIGate,AI安全控制点从边界转向GPU加速内联
Fortinet发布FortiAIGate,集成NVIDIA Blackwell GPU与Dynamo推理框架,以内联模式实时保护数据中心和云端AI工作负载、数据与自主代理。声称极低延迟、多租户扩展,支持地端、云端、混合云及边缘部署。
Anthropic发布Claude Fable 5:一天迁移5000万行代码,AI代码重构迈入实用拐点
Anthropic推出Claude Fable 5模型,在软件工程、推理等长程任务上领先。Stripe使用该模型在一天内完成5000万行Ruby代码库迁移,标志着AI辅助代码迁移能力达到实用水平。同时发布报告称Claude已撰写公司80%以上代码,并呼吁行业建立可验证的暂停机制。
谷歌推出Android 17系统多项AI功能分阶段上线
...
台积电首次公开CoWoS玻璃基板开发计划
...
英伟达联手Coherent扩产磷化铟光互连,锁定AI机架级光速传输架构
英伟达战略投资Coherent,在德州扩建6英寸磷化铟晶圆工厂,专供AI数据中心机架间光互连。Vera Rubin Ultra NVL576场景中,576个GPU跨8个机架必须依赖硅光技术,铜缆已无法满足带宽和距离需求。此举标志着AI互连从铜向光的架构迁移加速。
ARM自研AGI CPU量产获20亿预订单,AI推理架构向ARM迁移加速
ARM宣布其自研AGI CPU已与台积电合作量产,获得20亿美元预订单,并与Red Hat合作优化企业软件栈。此举标志着ARM从IP授权向自研芯片的战略转折,有望在AI推理领域挑战x86主导地位。
Google TPU 8代训练推理芯片分离,AI基础设施性价比拐点到来
Google Cloud推出第八代TPU,将训练芯片TPU8t与推理芯片TPU8i分离,训练Pod级性能提升3倍,推理美元当量性能提升80%。同时Vertex AI进化为Gemini Enterprise Agent Platform,结合Smals主权云合同,加速公共部门AI采纳。
高通AI200借AWS入云:推理芯片生态从英伟达独走向多元联盟
高通AI200推理芯片(768GB内存)预计2026年大规模部署于AWS,旨在降低云推理成本。此举标志着高通从移动端向云数据中心的关键战略转移,并借助AWS定制化芯片战略,直接挑战英伟达在AI推理环节的垄断地位,重构云推理芯片生态联盟。
NVIDIA联手SK Hynix锁定HBM4/5标准,Vera Rubin供应链闭环成型
NVIDIA与SK Hynix签署多年协议,联合定义HBM4量产及HBM5预研,覆盖Vera Rubin GPU架构。Samsung同步进入HBM4供应链。此举将SK Hynix从供应商升级为联合开发者,可能形成事实上的AI内存标准壁垒,挤压美光等对手空间。
AMD Zen 6 Venice 256核EPYC以3.3倍机柜性能反击NVIDIA Vera,但预估数据存疑
AMD首次公布基于2nm制程的Zen 6 Venice EPYC处理器性能预估,在100kW整柜功耗下,以SPEC CPU 2017_rate基准,整数吞吐量达NVIDIA Vera CPU的3.3倍。此举是对NVIDIA Arm生态入侵x86数据中心领域的直接回应,但数据为理论推演而非实测硅片。
AMD投建全栈Instinct GPU云:TensorWave B轮融资暴露NVIDIA生态破局战略
TensorWave完成3.5亿美元B轮融资,AMD Ventures联合领投,估值达15.5亿美元。该云平台完全基于AMD Instinct GPU(MI300X至MI455X)构建,主攻记忆密集型AI工作负载,旨在提供绕过NVIDIA CUDA锁定的替代算力路径,并验证ROCm软件栈的商业化成熟度。
Intel发布解耦推理架构与至强6+,联合SambaNova富士康构建机架级AI基础设施
Intel在Computex 2026发布三项核心成果:1)与SambaNova、富士康共建机架级AI基础设施,已量产;2)全球首个全解耦推理系统公开演示——Xeon 6编排+SN40 RDU解码+NVIDIA Blackwell GPU预填充,Together.ai运行MiniMax 2.5达最快企业级推理速度;3)Xeon 6+——首款18A制程数据中心CPU,单机架32U空间36864核心@约100kW。Agent推理时代CPU:GPU配比从1:4向1:1演变。
华为云发布AICS灵衢智算集群:Token工业化时代的控制平面转移与Agent锁定
华为云发布四大Agentic Infra新品,核心为AICS灵衢智算集群(10万卡/200 EFLOPS),通过NPU直通CMS硬件、CCE VolcanoNext通智一体化调度引擎与AgentSphere安全沙箱,构建从算力、记忆到调度、安全的统一控制平面,旨在锁定大模型训练与Agent推理的全栈基础设施。
微软Maia 200量产+Cobalt 200预览:自研双芯合围NVIDIA,AI推理控制权转移
微软在Build 2026宣布Maia 200 AI推理芯片量产,Cobalt 200 ARM处理器预览,并推出350亿参数的MAI-Thinking-1推理模型。此举标志着微软正构建从硅片到模型的完全自研AI堆栈,意图在推理环节降低对NVIDIA GPU的依赖,并锁定Azure AI工作负载。
Build 2026:Project Polaris自研模型替代GPT-4 Turbo,GitHub Copilot开启去OpenAI化
微软在Build 2026开发者大会发布Project Polaris自研编码模型,计划2026年8月起替代OpenAI GPT-4 Turbo成为GitHub Copilot默认推理引擎,3个月过渡期可选保留旧模型。这标志着微软首次从模型层正式脱离对OpenAI的依赖。同时Anthropic Claude已集成进Copilot,支持多模型draft+review协同工作流。微软首次公开将Claude列为主要追赶目标,战略信号:模型层自立,分发和运行时才是持久护城河。
英特尔联合SambaNova推机架级AI推理方案,至强6+ 288核重夺话语权
英特尔在Computex 2026推出基于至强6+处理器和SambaNova SN-50 RDU的机架级AI基础设施,以及采用解耦推理(预填充/解码分离)的Vector Core Compute云服务。至强6+基于Intel 18A,288核,专为横向扩展的Agentic AI推理设计,意图以CPU+RDU组合降低推理TCO。
NVIDIA RTX Spark:以SoC形态夺取PC控制权,AI算力革命或锁定生态
NVIDIA发布RTX Spark SoC,集成Blackwell GPU与20核Grace CPU(MediaTek设计),通过NVLink-C2C实现600GB/s互联,最高128GB统一内存,1 petaflop FP4 AI算力,支持本地运行1200亿参数大模型。此举从GPU供应商跃升为整机方案商,直接挑战Apple M系列、Qualcomm及x86阵营。