N
NVIDIA
2026-06-25
Industry Signal 影响: Major 置信: 95%

OpenAI联手Broadcom推出Jalapeno推理芯片,重塑AI硬件生态

内容摘要

OpenAI与Broadcom合作开发了名为Jalapeno的LLM推理加速芯片,采用多芯片模块、HBM3E内存,9个月完成流片。该芯片专为OpenAI模型栈优化,旨在降低推理成本并减少对NVIDIA GPU的依赖,计划2026年底部署。

核心要点

OpenAI发布了与Broadcom合作开发的Jalapeno推理加速芯片,这是一款固定功能与可编程计算硬件结合的ASIC,专门优化其LLM推理工作负载,覆盖ChatGPT、Codex、API及未来Agent产品。芯片采用多芯片模块设计,中央逻辑单元周围环绕8个HBM3E堆栈,容量可达192-288GB。OpenAI声称这是最快的ASIC开发周期,仅9个月从设计到流片。

Jalapeno是多代计算平台的一部分,首批部署预计在2026年底。与Google TPU不同,Jalapeno仅专注于推理,训练仍使用GPU。目前未公布具体算力、功耗或性能指标,但强调与Broadcom的合作实现了快速迭代。

重要性说明

OpenAI此举表面是优化推理成本,实质是合围NVIDIA,通过自研芯片剥夺其推理市场的垄断利润。Jalapeno的专有架构将深度绑定OpenAI模型栈,形成模型-芯片垂直锁定:企业若想获得最佳推理效率,必须使用OpenAI的硬件或云服务,从而被锁定在OpenAI生态内。

原文刻意隐瞒了关键短板:作为9个月流片的ASIC,其性能/功耗比很可能远低于NVIDIA的成熟GPU(如H100/B200),且软件生态几乎为零——开发者无法通用编程,仅能运行OpenAI模型。此外,HBM3E的供应受限于三星/海力士,产能风险未提及。对于大规模推理集群,尾部延迟散热设计也是未知数,而NVIDIA的NVLinkInfiniband网络优势是Jalapeno无法复制的。

PRO 决策建议

【厂商】竞争对手(如NVIDIA、AMD、Intel)应立即强化推理优化库(如TensorRT、ROCm),并推出开放推理接口,让企业能在自家GPU上运行OpenAI模型栈(通过ONNX Runtime等),打破Jalapeno的锁定。同时,NVIDIA应加快Spectrum-X等网络方案,强调GPU集群的端到端性能优势

【企业】CIO需警惕供应商锁定:Jalapeno仅支持OpenAI模型,若未来模型切换或混合部署,将面临高昂迁移成本。建议进行独立基准测试,对比Jalapeno与现有GPU的实际推理吞吐量和TCO。优先采用开放硬件标准(如OCP)和跨平台推理引擎(如vLLM),保持架构弹性。

【投资者】看穿公关辞令:9个月流片意味着功能妥协高验证风险。OpenAI的硬件投入将大幅增加资本支出,短期盈利能力承压。长期看,若Jalapeno性能不及预期,OpenAI可能被迫继续采购GPU,自研芯片沦为成本黑洞。关注Broadcom的ASIC设计服务收入增长,但需警惕客户集中度风险。

来源: Techpowerup
查看原文 →

觉得这篇分析有用?

每周收到3-5条AI基础设施关键信号 →

💬 评论 (0)