Product Launch 影响: Major 置信: 85%

Google发布第八代TPU:训练性能3倍跃升,推理SRAM暴增3倍,锁定AI算力新拐点

内容摘要

Google Cloud Next 2026推出第八代TPU,分为训练专用TPU 8t(单Pod 9600颗,2PB共享内存)和推理专用TPU 8i(1152颗,片上SRAM增3倍)。同时发布Gemini Enterprise Agent Platform,整合AI代理构建、治理与安全,并推出N4 Axion ARM实例(性价比2倍于x86)。

核心要点

Google Cloud Next 2026上,CEO Sundar Pichai宣布了第八代TPU,采用双芯片策略:TPU 8t专注于训练,单个超级Pod可扩展至9600个TPU,配备2PB共享高带宽内存,训练处理能力是上一代Ironwood的3倍,每瓦性能提升2倍。TPU 8i针对推理优化,单Pod连接1152个TPU,片上SRAM增加3倍,可并发运行数百万AI智能体。

此外,Google推出了Gemini Enterprise Agent Platform,提供构建、扩展、治理和优化企业智能体的全栈解决方案,并整合了基于Threat IntelligenceWiz的AI驱动网络安全,以及Wiz AI Application Protection Platform。Google内部75%的新代码由AI生成并经工程师批准。

在通用计算方面,N4 Axion实例基于ARM架构,相比同代x86实例提供2倍更好的性价比。Agentic Data Cloud帮助企业数据被AI智能体快速读取和利用。

重要性说明

Google此次发布表面是硬件升级,实则是在防守NVIDIA在AI训练领域的统治地位,并合围AWS和Azure的自研芯片阵营。TPU 8t的3倍性能提升直接瞄准NVIDIA的B200/GB200,而TPU 8i的SRAM暴增则针对推理场景中的内存带宽瓶颈,意图将用户从NVIDIA GPU生态(CUDA、TensorRT)迁移到Google的TPU+JAX/TensorFlow栈。

更隐蔽的锁定在于Gemini Enterprise Agent PlatformAgentic Data Cloud。Google通过全栈代理平台,将企业AI应用从模型层绑定到Google Cloud的治理、安全、数据管道,剥夺了用户使用多模型(如Llama、Claude)的架构弹性。N4 Axion实例看似性价比提升,实则是为了吸引通用计算负载,进一步加深对Google Cloud基础设施的依赖。

物理限制方面:TPU 8t的9600颗规模依赖Google自研光互连Jupiter网络,外部客户无法在自有数据中心复现,导致供应商锁定风险极高。TPU 8i的SRAM增加虽缓解推理延迟,但片上SRAM容量仍远小于HBM带宽的潜在需求,在超大模型(万亿参数)推理中可能遭遇尾部延迟问题。此外,Google未披露TPU 8t/8i的具体HBM容量互连带宽,掩盖了与NVIDIANVLinkInfiniBand的对比劣势。

PRO 决策建议

【厂商(竞争对手)】

  • NVIDIA:立即针对TPU 8t/8i的短板进行技术反击。强化NVLink 5InfiniBand的互连优势,推出对比基准测试,突出TPU在万亿参数模型中的尾部延迟HBM容量不足。同时加速GB300的推理优化,利用CUDA生态的成熟工具链(TensorRT、Triton)对抗JAX的封闭性。
  • AWS/Amazon:加速Trainium3Inferentia3的迭代,强调多租户隔离混合云部署的灵活性,攻击Google TPU无法在本地或第三方数据中心运行的硬伤。推广SageMakerBedrock的跨模型支持,弱化Gemini Agent Platform的锁定效果。

【企业(CIO与架构师)】

  • 对TPU 8t/8i进行零信任技术审计:要求Google提供详细的HBM规格、互连拓扑、尾部延迟分布,并与NVIDIA H100/B200进行独立第三方基准测试,特别是大规模分布式训练线性扩展效率
  • 评估Gemini Enterprise Agent Platform跨云可移植性:确认是否支持导出代理到AWS/Azure,或是否强制使用Google的Vertex AIBigQuery。避免被Agentic Data Cloud的专有数据格式锁定。
  • 考虑混合云策略:将关键AI负载保留在自有数据中心或第三方云,利用Kubernetes开放模型(Llama、Mistral)保持弹性,仅在Google Cloud运行对TPU性能极度敏感的训练任务。

【投资者】

  • 短期看多Google Cloud的AI基础设施领先,但需警惕资本开支压力:TPU 8t的庞大Pod规模(9600颗)需要巨额数据中心投资,可能压缩利润率。
  • 关注NVIDIA的营收风险:如果TPU 8t在训练市场获得10%以上份额,将侵蚀NVIDIA的数据中心收入,但NVLink和CUDA的粘性使短期替代有限。
  • 长期看好自研AI芯片赛道,但需辨别供应商集中度风险:Google、AWS、Azure的自研芯片均锁定其云平台,不利于企业多云战略,可能催生白盒AI加速器(如Tenstorrent、Groq)的机遇。

来源: Google Blog
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)