情报
AI 生成的结构化厂商动态简报
Anthropic联合谷歌与博通锁定千兆瓦级下一代TPU算力
Anthropic宣布与谷歌及博通达成新协议,锁定数千兆瓦的下一代TPU算力,预计2027年上线。此举旨在支撑其前沿Claude模型的训练与推理,并满足全球客户激增的需求。该合作是Anthropic对美国计算基础设施500亿美元投资承诺的重大扩展。
NVIDIA推动物理AI在机器人领域的技术整合
NVIDIA在机器人周展示物理AI技术突破,通过Isaac Sim模拟平台和Jetson Orin边缘模块加速农业机器人部署。案例显示Aigen利用合成数据训练和开放世界基础模型,实现太阳能机器人精准除草,降低90%除草剂依赖。
NVIDIA优化VC-6解码器架构,提升批量AI视觉管道性能
NVIDIA通过Nsight工具分析,对其VC-6视频解码器进行架构级重构,从单图解码器转向支持批量处理的单一解码器,并优化GPU内核,显著降低批处理场景下的解码延迟,提升AI视觉管道效率。
ARM联合Google优化Gemma 4设备端AI性能
ARM通过Armv9架构的SME2技术加速Google Gemma 4模型在移动设备的运行,实现5.5倍预填充加速和1.6倍解码提速。该合作使开发者无需修改代码即可获得性能优化,推动设备端AI成为移动应用默认架构,降低云端依赖。
英伟达联合谷歌优化Gemma 4,强化本地AI代理基础设施
英伟达宣布与谷歌合作,针对其RTX、DGX Spark及Jetson平台,对Gemma 4系列开源模型进行深度优化。此举旨在将高性能、多模态AI推理能力从云端扩展至边缘设备和个人工作站,为本地AI代理(Agentic AI)提供从2B到31B参数的全栈模型支持。
NVIDIA 优化 Gemma 4 模型以加速本地代理 AI
NVIDIA 与 Google 合作优化 Gemma 4 系列模型,使其能够在从边缘设备到高性能 GPU 的各种 NVIDIA 硬件上高效运行。这些模型支持多种任务,包括推理、编码和代理功能,适用于本地代理 AI 应用。
谷歌发布Gemma 4开源模型,瞄准边缘推理与AI代理架构
谷歌推出Gemma 4开源模型家族,包含从2B到31B的四个版本,强调单位参数性能突破,并原生支持AI代理工作流、多模态与长上下文。其小参数模型专为边缘设备优化,旨在将前沿推理能力扩展至移动与IoT场景。
Google发布Gemma 4开源模型系列
Google推出Gemma 4开源模型系列,包含四种规模变体,特别优化边缘计算和移动设备。该系列支持多模态处理、长上下文窗口和140多种语言,采用Apache 2.0许可。
微软将MAI多模态模型系列全面集成至Foundry平台
微软宣布将自研的MAI多模态模型家族(包括转录、语音、图像模型)全面提供给Foundry平台的开发者。此举旨在通过统一的平台层,降低企业开发者集成和编排多模态AI能力的复杂性,推动AI从独立产品向企业基础设施层转变。
思科推出AI就绪宽带解决方案应对边缘计算挑战
思科发布Agile Services Networking和Unified Edge平台,旨在帮助宽带服务提供商应对AI带来的带宽激增和低延迟需求。该方案通过在网络边缘部署计算和推理能力,减少核心网络负载,并支持智能流量优先级管理。
思科推出验证式AI基础设施解决方案
思科发布经过验证的AI基础设施设计方案,通过与NVIDIA和红帽合作,提供预集成、测试的AI POD解决方案,旨在解决企业DIY AI基础设施时的兼容性和安全问题。该方案包含计算、网络、存储和AI软件的完整堆栈,并提供模块化扩展能力。
AWS与西门子能源深化合作推进数据中心能源解决方案
AWS宣布与西门子能源扩大战略合作,将AWS云服务和AI技术(包括Amazon Bedrock和SageMaker)应用于西门子能源的智能制造和工厂自动化。双方还将共同探索数据中心电力基础设施的创新方案,包括千兆瓦级发电和微电网技术。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
ARM推出自研AGI CPU芯片,扩展AI基础设施布局
ARM首次推出自研AGI CPU芯片,突破传统IP授权模式,提供从定制化芯片到完整平台解决方案的全栈能力。此举将重构AI基础设施供应链控制权,推动企业从硬件层优化AI工作负载部署效率。
英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能
英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能,特别是在处理大型语言模型(LLM)时的表现。测试结果显示,配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型,并在多GPU设置中提供高达1.8倍的推理性能提升。
思科推出全栈后量子密码架构
思科在Cisco Live 2026上发布业界首个全栈后量子密码(PQC)架构,该方案采用NIST认证的量子抗性算法,覆盖从设备启动完整性到数据传输保护的全栈安全层。此举标志着二十年来最重要的密码学突破,旨在应对量子计算带来的'现在收集未来解密'威胁。
AWS与Flagship合作加速生命科学AI创新
AWS宣布与Flagship Pioneering达成战略合作,将成为Flagship旗下公司的首选云服务提供商,为其提供云计算资源、技术支持及AI能力,以加速药物发现和科学平台开发。Flagship的早期公司可获得AWS云积分、技术支持和市场资源,内部团队也将获得专业支持以增强其公司创建和扩展能力。
NVIDIA联合能源厂商推动AI工厂成为智能电网资产
NVIDIA与能源软件公司Emerald AI合作,提出将大型AI数据中心(AI工厂)从静态电力负载转变为可灵活响应电网状况的智能资产。该架构整合了加速计算、电力网络与控制,旨在提升电网可靠性并优化能源使用效率。多家大型能源公司计划基于此架构合作,以支持AI负载并加速电力接入。
NVIDIA联合能源企业推进AI工厂与电网协同架构
NVIDIA与Emerald AI合作推出将AI工厂作为智能电网资产的新架构,整合加速计算、实时能源调度和参考设计,使大规模AI部署能动态响应电网需求。该方案基于Vera Rubin DSX参考设计和Conductor平台,已获多家能源企业支持实施。
OpenAI 融资1220亿美元加速全球AI基础设施建设
OpenAI宣布获得1220亿美元融资,将用于扩展全球前沿AI能力、投资下一代计算基础设施,并满足ChatGPT、Codex和企业级AI的快速增长需求。这笔创纪录融资将显著提升其AI训练集群和推理基础设施的建设规模。