情报
AI 生成的结构化厂商动态简报
Anthropic 9000亿估值背后:跨云算力布局如何重塑企业AI采购的厂商锁定风险
Anthropic以9000亿估值融资背后是三云算力布局策略,企业使用Claude实际在同时绑定AWS、Google、NVIDIA三方,厂商锁定风险从单云升级为跨云架构级锁定
Google Cloud Next 26开幕:发布Agentic Cloud战略
Google Cloud Next 26开幕,发布企业级Agentic AI全栈。
Google全域算力池化:资源利用率从35%提升至85%
Google发布全域算力池化技术,资源利用率从35%提升至85%+,成本降低40%+,支持跨区域、跨云厂商资源整合。
Google TPU v8发布:单集群算力突破40 ExaFLOPS
Google发布TPU v8芯片,单集群算力达40+ ExaFLOPS,支持百万级Agent并发,算力密度提升3倍,能效比提升2倍。
Anthropic 千兆瓦级 TPU 合作,算力门槛进核电时代
Anthropic 与 Google、Broadcom 达成多个千兆瓦级下一代 TPU 算力合作协议,预计 2027 年上线支持前沿 Claude 模型训练。年化营收突破 300 亿美元(约三个月增长 3 倍),AI 基础设施投资门槛正式进入核电站级别。
微软联合日本本土运营商构建主权AI基础设施
微软宣布未来四年在日投资100亿美元,核心是与日本樱花互联网和软银合作,通过Azure提供由本土运营商管理的GPU算力服务,确保数据驻留日本。此举旨在满足日本对数据主权和合规性要求严格的AI工作负载需求。
Anthropic联合谷歌与博通锁定千兆瓦级下一代TPU算力
Anthropic宣布与谷歌及博通达成新协议,锁定数千兆瓦的下一代TPU算力,预计2027年上线。此举旨在支撑其前沿Claude模型的训练与推理,并满足全球客户激增的需求。该合作是Anthropic对美国计算基础设施500亿美元投资承诺的重大扩展。
AWS与TGS达成战略合作,推动能源行业AI与HPC转型
TGS选择AWS作为首选云提供商,利用AWS的高性能计算和生成式AI构建能源勘探解决方案。合作包括现代化TGS Imaging AnyWare平台,部署多模态地下基础模型,并利用AWS Nitro系统确保工作负载安全。
英伟达组建Nemotron联盟,推动开放前沿模型协作
英伟达在GTC上宣布成立Nemotron联盟,联合Mistral AI等模型构建者和AI实验室,共同开发前沿级开源基础模型。此举旨在通过共享专业知识、数据和算力,推动开放模型生态,并强调未来AI将由开放与专有模型共同构成的系统驱动。
NVIDIA组建开放模型联盟推动Nemotron生态发展
NVIDIA宣布成立全球首个开放前沿模型联盟,联合Mistral AI等机构共同开发基础模型。联盟成员将共享数据、算力和专业知识支持模型后训练,Nemotron模型下载量已超4500万次。该举措旨在推动开放模型生态创新,对抗封闭模型体系。
英伟达联合能源机构展示AI算力工厂参与电网调峰
英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作,成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求,动态调节自身功耗以充当电网的“减震器”,同时保障高优先级AI工作负载的性能。
Meta与Arm合作开发AI专用数据中心CPU
Meta宣布与Arm共同开发专为AI工作负载设计的数据中心CPU Arm AGI,该CPU旨在显著提升性能密度和能效。Meta将作为主导合作伙伴,计划通过开放计算项目公开硬件设计,并与自研MTIA芯片协同工作。
NVIDIA定义柔性AI工厂为可调度电网资产
NVIDIA联合能源公司推出柔性AI工厂概念,通过AI平台实现计算负载与电网需求动态协调。该方案使AI数据中心从能源消费者转变为具备电网支持能力的产消者,通过软件定义和AI优化提升能源系统韧性。
NVIDIA Blackwell架构实现25倍能效提升
NVIDIA发布Blackwell GPU架构,通过Transformer引擎和NVLink互联技术创新,实现比前代Hopper架构25倍的能效提升。这一架构级突破将显著降低AI训练和推理的运营成本,直接影响数据中心TCO和可持续性指标。
NVIDIA 提升云游戏 VR 流媒体帧率至 90 FPS
NVIDIA GeForce NOW 云游戏服务将 VR 流媒体帧率从原有水平提升至 90 FPS,覆盖 Apple Vision Pro、Meta Quest 和 Pico 等设备。该更新面向 Ultimate 会员,结合新增 RTX 5080 级云端算力支持,旨在优化高画质游戏体验。
AMD定义智能体计算机愿景推动端侧AI架构
AMD发布2026年AI PC路线图,提出智能体计算机概念,通过扩展Ryzen AI技术栈实现NPU、GPU、CPU异构计算架构。该架构支持本地运行多模态AI智能体,推动PC从生产力工具向主动AI伙伴转变。
AMD与Celestica合作推出机架级AI平台Helios
AMD与电子制造服务商Celestica合作推出Helios机架级AI平台,集成Instinct加速器和EPYC处理器,提供从芯片到机架级的整体优化。该平台针对AI训练和推理任务进行性能与能效优化,旨在满足数据中心和云服务提供商的AI算力需求。
AMD与Upstage合作推出基于MI325X的主权AI基础设施方案
AMD与韩国AI公司Upstage深化合作,基于Instinct MI325X加速器构建主权AI基础设施解决方案。通过优化ROCm软件栈实现Solar LLM与硬件平台深度集成,提升AI训练和推理效率。该方案针对韩国市场数据主权要求提供本地化AI算力。
NVIDIA CloudXR集成Vision Pro,强化企业级XR串流方案
NVIDIA宣布CloudXR平台支持Apple Vision Pro,通过RTX GPU实现云端高保真XR内容串流。该方案解决了移动头显算力限制,专注于工业设计与数字孪生等企业级应用。
NVIDIA cuDF加速Spark数据处理,优化企业A/B测试工作流
NVIDIA通过cuDF GPU DataFrame库和CUDA-X库,在Google Kubernetes Engine上加速Apache Spark工作流,使Snap实现4倍性能提升和76%成本节省。该方案支持无需代码修改的Spark应用迁移,处理超10PB数据。
NVIDIA AI网格:AT&T、T-Mobile等共建分布式AI推理平台
NVIDIA在GTC 2026上宣布AI网格战略,电信运营商将现有网络基础设施转化为地理分布式AI推理平台。AT&T、T-Mobile、Comcast、Spectrum、Akamai等主要运营商参与,共建分布式边缘AI基础设施。AI网格通过在网络边缘部署推理能力,实现更低延迟和更优Token成本。
NVIDIA联合电信运营商构建AI网格优化分布式推理
NVIDIA在GTC 2026宣布与多家电信运营商合作构建AI网格架构,通过动态分配推理任务至网络最佳位置,降低延迟并提升效率。该架构标志着AI计算与通信基础设施的深度融合,应对AI原生应用向边缘扩展的趋势。
Adobe与NVIDIA战略合作优化AI PC端创意工作流
Adobe与NVIDIA达成战略合作,共同开发下一代Firefly生成式AI模型,并针对NVIDIA RTX AI PC进行性能优化。合作重点是将AI能力深度集成到Creative Cloud、Experience Cloud等核心产品工作流中,加速创意营销和智能体流程。
NVIDIA推出开放智能体开发平台加速物理AI应用
NVIDIA发布开放智能体开发平台,推动AI智能体从虚拟环境向物理世界操作转变。该平台旨在降低复杂任务自主系统的开发门槛,支持制造业、物流等领域的自动化进程。
思科通过认证翻新设备加速AI数据中心部署
思科推出认证翻新设备计划,通过提供经过严格测试、性能与新品一致且享有完整保修的硬件,帮助企业快速构建AI就绪数据中心。该方案可将部署时间压缩高达80%,同时优化资本效率和推进可持续发展。
NVIDIA与Thinking Machines Lab达成千兆瓦级AI基础设施合作
NVIDIA与Thinking Machines Lab宣布部署至少一千兆瓦的下一代Vera Rubin系统,用于前沿AI模型训练。该合作体现了超大规模AI算力需求的新标杆,标志着AI基础设施向千兆瓦级部署迈进。
Meta加速自研AI芯片路线图,专注推理优化
Meta计划两年内推出四代自研AI芯片MTIA系列,采用‘推理优先’设计策略,专注于生成式AI推理任务优化。芯片基于PyTorch和开放计算标准构建,支持数据中心无缝部署。这一快速迭代策略旨在提升计算效率和成本控制。
NVIDIA与Thinking Machines Lab达成千兆瓦级AI基础设施合作
NVIDIA与Thinking Machines Lab建立多年战略合作,部署至少1 GW的下一代Vera Rubin系统,支持前沿AI模型训练和可规模化定制AI平台。双方将共同设计训练和推理系统,并拓宽企业及研究机构对前沿AI和开源模型的访问。
NVIDIA提出AI五层蛋糕理论定义基础设施构建框架
NVIDIA CEO黄仁勋在达沃斯提出AI发展五层架构理论,从能源基础设施、计算基础设施、AI模型、AI应用到行业AI工厂系统化阐述全栈构建路径。该框架强调生成式AI驱动的基础设施层级化协同发展,为企业AI战略提供生态视角规划基础。
英特尔发布工业级Core Series 2处理器与医疗AI套件强化边缘AI
英特尔发布工业级Core Series 2处理器,针对边缘关键任务应用提供确定性性能,显著改善实时响应与PCIe延迟。同时推出第六个Edge AI套件,专注于医疗健康领域,提供多模态AI工作负载参考实现。