这项动态的影响程度如何？

该情报被评估为对企业具有重大影响，建议技术决策者关注。

NVIDIA 2026-06-25

Industry Signal 影响: Major 置信: 95%

OpenAI联手Broadcom推出Jalapeno推理芯片，重塑AI硬件生态

Q: 为什么NVIDIA的这项动态对企业重要？

OpenAI此举表面是优化推理成本，实质是**合围NVIDIA**，通过自研芯片剥夺其推理市场的垄断利润。Jalapeno的**专有架构**将深度绑定OpenAI模型栈，形成**模型-芯片垂直锁定**：企业若想获得最佳推理效率，必须使用OpenAI的硬件或云服务，从而被锁定在OpenAI生态内。 原文刻意隐瞒了关键短板：作为**9个月流片**的ASIC，其**性能/功耗比**很可能远低于NVIDIA的成熟GPU（如H100/B200），且**软件生态**几乎为零——开发者无法通用编程，仅能运行OpenAI模型。此外，**HBM3E**的供应受限于三星/海力士，产能风险未提及。对于大规模推理集群，**尾部延迟**和**散热设计**也是未知数，而NVIDIA的**NVLink**和**Infiniband**网络优势是Jalapeno无法复制的。

内容摘要

OpenAI与Broadcom合作开发了名为Jalapeno的LLM推理加速芯片，采用多芯片模块、HBM3E内存，9个月完成流片。该芯片专为OpenAI模型栈优化，旨在降低推理成本并减少对NVIDIA GPU的依赖，计划2026年底部署。

核心要点

OpenAI发布了与Broadcom合作开发的Jalapeno推理加速芯片，这是一款固定功能与可编程计算硬件结合的ASIC，专门优化其LLM推理工作负载，覆盖ChatGPT、Codex、API及未来Agent产品。芯片采用多芯片模块设计，中央逻辑单元周围环绕8个HBM3E堆栈，容量可达192-288GB。OpenAI声称这是最快的ASIC开发周期，仅9个月从设计到流片。

Jalapeno是多代计算平台的一部分，首批部署预计在2026年底。与Google TPU不同，Jalapeno仅专注于推理，训练仍使用GPU。目前未公布具体算力、功耗或性能指标，但强调与Broadcom的合作实现了快速迭代。

重要性说明

OpenAI此举表面是优化推理成本，实质是合围NVIDIA，通过自研芯片剥夺其推理市场的垄断利润。Jalapeno的专有架构将深度绑定OpenAI模型栈，形成模型-芯片垂直锁定：企业若想获得最佳推理效率，必须使用OpenAI的硬件或云服务，从而被锁定在OpenAI生态内。

原文刻意隐瞒了关键短板：作为9个月流片的ASIC，其性能/功耗比很可能远低于NVIDIA的成熟GPU（如H100/B200），且软件生态几乎为零——开发者无法通用编程，仅能运行OpenAI模型。此外，HBM3E的供应受限于三星/海力士，产能风险未提及。对于大规模推理集群，尾部延迟和散热设计也是未知数，而NVIDIA的NVLink和Infiniband网络优势是Jalapeno无法复制的。

PRO 决策建议

【厂商】竞争对手（如NVIDIA、AMD、Intel）应立即强化推理优化库（如TensorRT、ROCm），并推出开放推理接口，让企业能在自家GPU上运行OpenAI模型栈（通过ONNX Runtime等），打破Jalapeno的锁定。同时，NVIDIA应加快Spectrum-X等网络方案，强调GPU集群的端到端性能优势。

【企业】CIO需警惕供应商锁定：Jalapeno仅支持OpenAI模型，若未来模型切换或混合部署，将面临高昂迁移成本。建议进行独立基准测试，对比Jalapeno与现有GPU的实际推理吞吐量和TCO。优先采用开放硬件标准（如OCP）和跨平台推理引擎（如vLLM），保持架构弹性。

【投资者】看穿公关辞令：9个月流片意味着功能妥协和高验证风险。OpenAI的硬件投入将大幅增加资本支出，短期盈利能力承压。长期看，若Jalapeno性能不及预期，OpenAI可能被迫继续采购GPU，自研芯片沦为成本黑洞。关注Broadcom的ASIC设计服务收入增长，但需警惕客户集中度风险。

来源： Techpowerup

查看原文 →

觉得这篇分析有用？

每周收到3-5条AI基础设施关键信号 →

内容摘要

核心要点

重要性说明

PRO 决策建议

觉得这篇分析有用？

💬 评论 (0)