OpenAI 2026-06-30
Product Launch 影响: Major 置信: 85%

OpenAI联合博通发布Jalapeño推理芯片,9个月流片,2027年量产,直指GPU替代

内容摘要

OpenAI与博通合作推出首款定制推理芯片Jalapeño,采用自研大模型辅助设计,9个月完成从架构到流片。早期测试显示性能/瓦特显著优于现有方案,计划2027年规模化量产,标志着AI模型公司垂直整合芯片进入新阶段。

核心要点

OpenAI与博通联合发布首款定制推理芯片Jalapeño,由OpenAI负责架构设计,博通实现硅片与网络硬件,Celestica集成板卡与机架,台积电制造。依托自研大模型辅助,从顶层设计到流片仅耗时9个月,早期测试显示性能/瓦特显著优于现有方案。

物理样品已于2026年6月24日交付,计划2026年末小规模部署,2027年快速爬坡,2028年上半年全面规模化量产。博通2026财年Q2 AI半导体收入达108亿美元,同比暴增143%,CEO陈福阳称六大核心客户算力需求近乎无限。

市场研究显示,大规模推理部署中ASIC相比通用GPU总拥有成本(TCO)优势达40%至65%。TrendForce预测2026年定制AI芯片出货量增长44.6%,而商用GPU仅16.1%。

重要性说明

OpenAI此举表面是技术突破,本质是在防守NVIDIA的GPU垄断,并试图通过芯片-模型深度绑定锁定用户生态。Jalapeño针对OpenAI自家推理负载优化,若模型迭代(如从GPT-4到GPT-5),其架构灵活性存疑——定制ASIC的尾部延迟批处理效率可能随模型变化而退化,而NVIDIA GPU通过CUDA生态和TensorRT仍可灵活适配。

更关键的是,OpenAI与博通合作引入了博通网络硬件(可能是Tomahawk或Jericho系列交换机),这意味着用户若采用Jalapeño集群,可能被迫绑定博通的RoCEv2或InfiniBand网络方案,丧失跨厂商网络弹性。同时,Celestica的机架集成进一步加深供应链锁定——一旦量产爬坡延迟或良率问题(台积电先进制程产能紧张),用户将面临供应风险。

原文故意淡化ASIC的物理限制:定制芯片无法像GPU那样通过软件升级获得新算子支持,且内存带宽HBM容量固定,无法适应未来更大模型。此外,9个月快速流片可能牺牲了功耗优化散热设计,实际部署中机架功耗密度可能高于预期。

PRO 决策建议

【厂商(竞争对手)】
NVIDIA应立即加速GPU推理专用优化,如推出更高性价比的L40SB200变体,并强化CUDA生态的模型适配工具(TensorRT-LLM、Triton Inference Server),强调ASIC的灵活性不足。AMD可联合Broadcom的对手(如Marvell、Intel)推出开放ASIC参考设计,攻击Jalapeño的封闭生态。Google TPUAWS Trainium应突出自身已成熟的定制芯片生态和跨模型兼容性。

【企业(CIO/架构师)】
进行零信任技术审计:要求OpenAI提供Jalapeño与主流GPU(H100、B200)在相同模型下的独立基准测试,包括尾部延迟吞吐量/瓦特内存带宽利用率。评估博通网络锁定风险:是否支持标准RoCEv2开放交换机?要求合同明确芯片代际升级路径模型迁移成本。避免单一供应商依赖,保留多云/多硬件选择。

【投资者】
看穿公关辞令:Jalapeño的TCO优势基于当前模型,但模型迭代速度ASIC折旧周期(3-4年)不匹配。关注博通AI收入集中度(六大客户),若OpenAI自研芯片成功,博通可能失去一个核心客户。台积电先进制程产能紧张将影响量产节奏。长期看好定制ASIC趋势,但需警惕过度垂直整合带来的生态碎片化风险。

来源: 36Kr
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)