OpenAI携博通发布定制推理ASIC Jalapeño,9个月流片颠覆AI推理成本
内容摘要
核心要点
OpenAI与博通联合发布的Jalapeño是一款专为大语言模型(LLM)推理设计的专用集成电路(ASIC)。开发周期仅9个月,过程中OpenAI利用自身AI模型加速设计。分工上,OpenAI负责底层架构设计,博通负责硅片实现与网络硬件(包括Tomahawk网络芯片),Celestica负责板卡与机架系统集成。
目前工程样片已以量产目标频率和功耗运行GPT-5.3、Codex和Spark等工作负载。早期测试表明,Jalapeño的每瓦性能优于当前最先进水平。架构上减少了数据移动,实现了计算、内存与网络资源的均衡配置,使实际利用率更接近理论峰值性能。
OpenAI表示Jalapeño是多代计算平台的第一步,计划2026年底首次部署。博通CEO表示,这标志着跨越数代的路线图开端,助力微软及其他合作伙伴自2026年起部署千兆瓦级数据中心。
重要性说明
OpenAI推出Jalapeño,表面是技术升级,本质上是防守NVIDIA在AI推理芯片领域的垄断地位,并合围其他AI模型厂商(如Google、Anthropic)通过自研芯片降低推理成本。通过定制ASIC,OpenAI试图锁定其模型生态:未来GPT-5.3等模型可能针对Jalapeño架构优化,形成软硬件协同壁垒,迫使客户使用OpenAI的推理服务而非通用GPU。
然而,原文刻意淡化了物理限制:定制ASIC的灵活性远低于GPU,无法适应快速变化的模型架构(如MoE、注意力机制变体)。一旦模型架构迭代,Jalapeño可能面临资产折旧风险。此外,9个月流片周期暗示设计可能牺牲了可编程性和通用性,实际部署中可能遇到尾部延迟问题,且依赖博通的Tomahawk网络芯片可能形成新的供应链锁定。
PRO 决策建议
【厂商】NVIDIA应加速推出针对推理的定制GPU或ASIC,利用CUDA生态优势,强调通用性和可编程性,并展示Jalapeño在模型迭代时的局限性。同时,NVIDIA可推出更高效的推理加速卡(如H200或B200),并开放推理优化工具链,削弱OpenAI的锁定效应。
【企业】CIO和架构师应保持警惕:Jalapeño可能带来短期推理成本优势,但存在供应商锁定风险。建议进行零信任技术审计,评估Jalapeño与现有GPU集群的互操作性,以及模型迁移成本。优先选择开放标准(如OpenAI的API但可替换后端)或基于PCIe的通用加速器,避免依赖专有网络(如博通Tomahawk)。
【投资者】需穿透公关辞令:Jalapeño的成功取决于OpenAI模型长期稳定性和博通产能。短期内可能打压NVIDIA股价,但长期看,定制ASIC的专用性限制了市场规模。投资者应关注OpenAI是否开放芯片给第三方使用,否则只是垂直整合故事。博通虽受益,但依赖单一客户风险高。
觉得这篇分析有用?
每周收到3-5条AI基础设施关键信号 →
💬 评论 (0)