筛选

×
当前筛选 清除全部
关键词: 推理优化 ×
7 情报总数
OpenAI 其他 2026-06-26

OpenAI联手博通9个月流片自研推理芯片Jalapeño,剑指NVIDIA生态

OpenAI与博通联合发布首款自研推理ASIC芯片Jalapeño,采用TSMC 3nm工艺,专为Transformer推理优化,目标推理成本降低50%。从设计到流片仅9个月,计划2026年底部署于千兆瓦级数据中心,标志着OpenAI向全栈AI基础设施提供商转型,直接挑战NVIDIA在推理市场的控制权。

MediaTek 其他 2026-06-23

联发科独家接单谷歌TPU v9推理升级款Triggerfish,SRAM缓存翻倍

谷歌计划推出TPU v9推理优化升级款Triggerfish,由联发科独家代工。该芯片SRAM缓存规模为前代2-3倍,DRAM升级至HBM4E,并引入simulation die用于本地管理。预计2027年底投产,生命周期出货100-200万颗,单价高出约三成。

Microsoft Azure 其他 2026-06-22

Google发布第八代TPU:训练性能3倍跃升,推理SRAM暴增3倍,锁定AI算力新拐点

Google Cloud Next 2026推出第八代TPU,分为训练专用TPU 8t(单Pod 9600颗,2PB共享内存)和推理专用TPU 8i(1152颗,片上SRAM增3倍)。同时发布Gemini Enterprise Agent Platform,整合AI代理构建、治理与安全,并推出N4 Axion ARM实例(性价比2倍于x86)。

Google 其他 2026-06-17

谷歌推出Android 17系统多项AI功能分阶段上线

...

NVIDIA 其他 2026-05-25

NVIDIA Vera CPU冲击x86:1.5倍性能与4倍密度,AI推理全栈锁定

据传闻,NVIDIA将在Computex 2026展示自研通用CPU Vera,性能达x86的1.5倍、吞吐量2倍、机架密度4倍。FY2027出货目标120万颗,FY2028达420万颗。Vera旨在满足AI推理时代CPU/GPU配比从1:8向1:1演进的需求,与Grace双线并行,构建GPU+CPU全栈生态。

Meta 其他 强信号 2026-03-11

Meta加速自研AI芯片路线图,专注推理优化

Meta计划两年内推出四代自研AI芯片MTIA系列,采用‘推理优先’设计策略,专注于生成式AI推理任务优化。芯片基于PyTorch和开放计算标准构建,支持数据中心无缝部署。这一快速迭代策略旨在提升计算效率和成本控制。

AMD 其他 中信号 2026-03-02

AMD推出ROCm AI开发者中心强化软件生态

AMD推出ROCm AI开发者中心,提供集中化软件工具和资源平台,支持开发者在AMD GPU上进行AI模型训练和推理优化。该平台通过文档、工具和最佳实践简化开发流程,提升从开发到部署的效率。