推理优化 - AI基础设施情报搜索

OpenAI 其他 2026-06-26

OpenAI联手博通9个月流片自研推理芯片Jalapeño，剑指NVIDIA生态

OpenAI与博通联合发布首款自研推理ASIC芯片Jalapeño，采用TSMC 3nm工艺，专为Transformer推理优化，目标推理成本降低50%。从设计到流片仅9个月，计划2026年底部署于千兆瓦级数据中心，标志着OpenAI向全栈AI基础设施提供商转型，直接挑战NVIDIA在推理市场的控制权。

MediaTek 其他 2026-06-23

联发科独家接单谷歌TPU v9推理升级款Triggerfish，SRAM缓存翻倍

谷歌计划推出TPU v9推理优化升级款Triggerfish，由联发科独家代工。该芯片SRAM缓存规模为前代2-3倍，DRAM升级至HBM4E，并引入simulation die用于本地管理。预计2027年底投产，生命周期出货100-200万颗，单价高出约三成。

Microsoft Azure 其他 2026-06-22

Google发布第八代TPU：训练性能3倍跃升，推理SRAM暴增3倍，锁定AI算力新拐点

Google Cloud Next 2026推出第八代TPU，分为训练专用TPU 8t（单Pod 9600颗，2PB共享内存）和推理专用TPU 8i（1152颗，片上SRAM增3倍）。同时发布Gemini Enterprise Agent Platform，整合AI代理构建、治理与安全，并推出N4 Axion ARM实例（性价比2倍于x86）。

Google 其他 2026-06-17

谷歌推出Android 17系统多项AI功能分阶段上线

...

NVIDIA 其他 2026-05-25

NVIDIA Vera CPU冲击x86：1.5倍性能与4倍密度，AI推理全栈锁定

据传闻，NVIDIA将在Computex 2026展示自研通用CPU Vera，性能达x86的1.5倍、吞吐量2倍、机架密度4倍。FY2027出货目标120万颗，FY2028达420万颗。Vera旨在满足AI推理时代CPU/GPU配比从1:8向1:1演进的需求，与Grace双线并行，构建GPU+CPU全栈生态。

Meta 其他强信号 2026-03-11

Meta加速自研AI芯片路线图，专注推理优化

Meta计划两年内推出四代自研AI芯片MTIA系列，采用‘推理优先’设计策略，专注于生成式AI推理任务优化。芯片基于PyTorch和开放计算标准构建，支持数据中心无缝部署。这一快速迭代策略旨在提升计算效率和成本控制。

AMD 其他中信号 2026-03-02

AMD推出ROCm AI开发者中心强化软件生态

AMD推出ROCm AI开发者中心，提供集中化软件工具和资源平台，支持开发者在AMD GPU上进行AI模型训练和推理优化。该平台通过文档、工具和最佳实践简化开发流程，提升从开发到部署的效率。

情报

筛选