情报
AI 生成的结构化厂商动态简报
OpenAI通过系统优化将推理成本砍半,数百GPU支撑ChatGPT海量请求
OpenAI通过模型量化(FP16→INT4/INT8)、KV-Cache优化、动态批处理与投机解码等系统底层技术,将AI推理成本降低50%以上,仅用数百张NVIDIA GPU支撑ChatGPT未登录用户流量。推理毛利率从38%跃升至65%,实现接近盈亏平衡。
谷歌Trillium TPU:4.7倍训练性能提升背后的算力锁定与生态陷阱
谷歌云发布第六代TPU Trillium,采用3纳米工艺,AI训练性能提升4.7倍,推理性能提升2.5倍,能效比H100高2倍。但Trillium仅限Google Cloud TPU v6p实例,深度绑定AI Hypercomputer架构,形成从芯片到网络的全栈锁定。
NVIDIA内部部署OpenAI Codex:万人使用GPT-5.5驱动智能体编程革命
NVIDIA超过10,000名员工使用OpenAI Codex,GPT-5.5运行于GB200 NVL72平台,推理成本降低35倍。
Google全域算力池化:资源利用率从35%提升至85%
Google发布全域算力池化技术,资源利用率从35%提升至85%+,成本降低40%+,支持跨区域、跨云厂商资源整合。
NVIDIA联合电信运营商构建分布式AI推理网格
NVIDIA与AT&T、Comcast等电信运营商合作,将全球10万个网络站点和100GW备用电力转化为分布式AI计算平台,支持低延迟推理。该AI网格已在物联网、云游戏等场景验证,实现端到端低于500毫秒延迟和50%成本降低。
ABB与NVIDIA通过Omniverse集成实现工业机器人高保真仿真
ABB Robotics与NVIDIA合作将Omniverse库集成至RobotStudio,推出RobotStudio HyperReality产品。通过USD文件导出和虚拟控制器实现99%仿真精度,支持AI训练流水线合成数据生成。该方案可降低40%部署成本并加速50%产品上市时间。
Telenor联合AWS与Scalstrm部署云原生北欧电视平台
Telenor与AWS和Scalstrm合作构建基于云的统一流媒体源平台,利用AWS云计算、Direct Connect低延迟连接和PB级存储,结合Scalstrm的IaC云原生技术。平台支持直播、回看、VOD和nPVR服务,提升弹性并降低运营成本。
谷歌扩展AI广告文本指南测试版,强化品牌内容控制
谷歌全球扩展AI Max广告平台中文本指南功能的测试版访问权限,允许广告商使用自然语言指令引导AI生成符合品牌标准的广告创意。该功能支持定义排除术语和避免概念,结合品牌洞察确保内容一致性和安全性。已有案例显示潜在客户获取量增加24%,成本降低26%。
OpenAI 将 GPT-5 与生物云自动化结合展示 AI 基础设施价值
OpenAI 展示了 GPT-5 与 Ginkgo Bioworks 的云自动化技术结合,在无细胞蛋白质合成实验中实现闭环实验,降低成本40%。这一合作凸显了大型语言模型在科学研发闭环中的基础设施潜力。