筛选

×
当前筛选 清除全部
关键词: 成本降低 ×
9 情报总数
OpenAI 其他 2026-07-03

OpenAI通过系统优化将推理成本砍半,数百GPU支撑ChatGPT海量请求

OpenAI通过模型量化(FP16→INT4/INT8)、KV-Cache优化、动态批处理与投机解码等系统底层技术,将AI推理成本降低50%以上,仅用数百张NVIDIA GPU支撑ChatGPT未登录用户流量。推理毛利率从38%跃升至65%,实现接近盈亏平衡。

Google Cloud 其他 2026-06-21

谷歌Trillium TPU:4.7倍训练性能提升背后的算力锁定与生态陷阱

谷歌云发布第六代TPU Trillium,采用3纳米工艺,AI训练性能提升4.7倍,推理性能提升2.5倍,能效比H100高2倍。但Trillium仅限Google Cloud TPU v6p实例,深度绑定AI Hypercomputer架构,形成从芯片到网络的全栈锁定。

NVIDIA 产品发布 强信号 2026-04-23

NVIDIA内部部署OpenAI Codex:万人使用GPT-5.5驱动智能体编程革命

NVIDIA超过10,000名员工使用OpenAI Codex,GPT-5.5运行于GB200 NVL72平台,推理成本降低35倍。

Google 其他 2026-04-22

Google全域算力池化:资源利用率从35%提升至85%

Google发布全域算力池化技术,资源利用率从35%提升至85%+,成本降低40%+,支持跨区域、跨云厂商资源整合。

NVIDIA 其他 强信号 2026-03-18

NVIDIA联合电信运营商构建分布式AI推理网格

NVIDIA与AT&T、Comcast等电信运营商合作,将全球10万个网络站点和100GW备用电力转化为分布式AI计算平台,支持低延迟推理。该AI网格已在物联网、云游戏等场景验证,实现端到端低于500毫秒延迟和50%成本降低。

NVIDIA 其他 强信号 2026-03-09

ABB与NVIDIA通过Omniverse集成实现工业机器人高保真仿真

ABB Robotics与NVIDIA合作将Omniverse库集成至RobotStudio,推出RobotStudio HyperReality产品。通过USD文件导出和虚拟控制器实现99%仿真精度,支持AI训练流水线合成数据生成。该方案可降低40%部署成本并加速50%产品上市时间。

Amazon 其他 中信号 2026-02-28

Telenor联合AWS与Scalstrm部署云原生北欧电视平台

Telenor与AWS和Scalstrm合作构建基于云的统一流媒体源平台,利用AWS云计算、Direct Connect低延迟连接和PB级存储,结合Scalstrm的IaC云原生技术。平台支持直播、回看、VOD和nPVR服务,提升弹性并降低运营成本。

Google 其他 中信号 2026-02-26

谷歌扩展AI广告文本指南测试版,强化品牌内容控制

谷歌全球扩展AI Max广告平台中文本指南功能的测试版访问权限,允许广告商使用自然语言指令引导AI生成符合品牌标准的广告创意。该功能支持定义排除术语和避免概念,结合品牌洞察确保内容一致性和安全性。已有案例显示潜在客户获取量增加24%,成本降低26%。

OpenAI 其他 中信号 2026-02-05

OpenAI 将 GPT-5 与生物云自动化结合展示 AI 基础设施价值

OpenAI 展示了 GPT-5 与 Ginkgo Bioworks 的云自动化技术结合,在无细胞蛋白质合成实验中实现闭环实验,降低成本40%。这一合作凸显了大型语言模型在科学研发闭环中的基础设施潜力。