情报
AI 生成的结构化厂商动态简报
Meta发布Muse Spark基础模型并重构AI助手架构
Meta推出其Superintelligence Labs的首个模型Muse Spark,并以此为核心全面升级Meta AI助手。新架构支持并行子代理(subagents)协同推理、强大的多模态感知能力,并能调用社交图谱内容提供个性化答案。
思科通过ThousandEyes MCP Server将AI引入MSP运维
思科宣布其ThousandEyes产品推出Model Context Protocol (MCP)服务器。该服务器将ThousandEyes的网络与数字体验洞察直接集成到AI助手(如Claude、ChatGPT)中,使MSP的分析师能通过自然语言进行高级诊断,旨在提升运营效率并改变MSP的服务模式。
思科深化与Nutanix合作,将超融合架构扩展至AI及边缘
思科宣布与Nutanix合作的多项进展,核心是将Nutanix云平台集成到思科AI POD、统一边缘及FlashStack架构中,旨在为从核心到边缘的AI和传统工作负载提供统一的、经过验证的部署蓝图与运营模型。
Arm与马来西亚莫纳什大学合作,推进AI时代半导体人才培养
Arm宣布与马来西亚莫纳什大学工程学院合作,捐赠集成电路设计开发板并派遣高管担任客座讲师,旨在为AI时代培养具备Arm架构和现代系统设计实践经验的半导体人才。
微软联合日本本土运营商构建主权AI基础设施
微软宣布未来四年在日投资100亿美元,核心是与日本樱花互联网和软银合作,通过Azure提供由本土运营商管理的GPU算力服务,确保数据驻留日本。此举旨在满足日本对数据主权和合规性要求严格的AI工作负载需求。
Anthropic投入1亿美元建立Claude合作伙伴网络
Anthropic宣布投入1亿美元启动Claude合作伙伴网络,为系统集成商、咨询公司等合作伙伴提供技术认证、联合市场开发和专属技术支持,旨在加速企业客户从概念验证到生产部署的进程。
Anthropic联合谷歌与博通锁定千兆瓦级下一代TPU算力
Anthropic宣布与谷歌及博通达成新协议,锁定数千兆瓦的下一代TPU算力,预计2027年上线。此举旨在支撑其前沿Claude模型的训练与推理,并满足全球客户激增的需求。该合作是Anthropic对美国计算基础设施500亿美元投资承诺的重大扩展。
微软发布Copilot Studio多智能体系统,推动企业AI架构互联
微软宣布Copilot Studio的多智能体系统全面上市,核心是通过开放协议(A2A)、与Fabric及Microsoft 365 Agents SDK的集成,实现跨工具、跨数据源的智能体协同编排。此举旨在将孤立的AI体验转变为可规模化协作的智能体系统,并增强了提示构建与治理控制。
NVIDIA优化VC-6解码器架构,提升批量AI视觉管道性能
NVIDIA通过Nsight工具分析,对其VC-6视频解码器进行架构级重构,从单图解码器转向支持批量处理的单一解码器,并优化GPU内核,显著降低批处理场景下的解码延迟,提升AI视觉管道效率。
AWS与西门子能源深化合作推进数据中心能源解决方案
AWS宣布与西门子能源扩大战略合作,将AWS云服务和AI技术(包括Amazon Bedrock和SageMaker)应用于西门子能源的智能制造和工厂自动化。双方还将共同探索数据中心电力基础设施的创新方案,包括千兆瓦级发电和微电网技术。
AMD发布突破性MLPerf 6.0推理结果,展示多节点扩展与多模态能力
AMD在MLPerf Inference 6.0基准测试中,凭借Instinct MI355X GPU在Llama 2 70B和GPT-OSS-120B模型上首次突破每秒100万令牌的推理吞吐量。其提交强调了多节点扩展效率、对新型文本到视频模型(Wan-2.2-t2v)的快速启用,以及广泛的合作伙伴生态系统复现结果。
英特尔在MLPerf推理测试中展示Xeon 6与Arc Pro GPU的AI性能
英特尔在MLPerf Inference v6.0基准测试中展示了其Xeon 6 CPU和Arc Pro B系列GPU的性能,特别是在处理大型语言模型(LLM)时的表现。测试结果显示,配备四块Arc Pro B70 GPU的系统能够处理120B参数的模型,并在多GPU设置中提供高达1.8倍的推理性能提升。
AWS与Flagship合作加速生命科学AI创新
AWS宣布与Flagship Pioneering达成战略合作,将成为Flagship旗下公司的首选云服务提供商,为其提供云计算资源、技术支持及AI能力,以加速药物发现和科学平台开发。Flagship的早期公司可获得AWS云积分、技术支持和市场资源,内部团队也将获得专业支持以增强其公司创建和扩展能力。
NVIDIA联合能源厂商推动AI工厂成为智能电网资产
NVIDIA与能源软件公司Emerald AI合作,提出将大型AI数据中心(AI工厂)从静态电力负载转变为可灵活响应电网状况的智能资产。该架构整合了加速计算、电力网络与控制,旨在提升电网可靠性并优化能源使用效率。多家大型能源公司计划基于此架构合作,以支持AI负载并加速电力接入。
NVIDIA联合能源企业推进AI工厂与电网协同架构
NVIDIA与Emerald AI合作推出将AI工厂作为智能电网资产的新架构,整合加速计算、实时能源调度和参考设计,使大规模AI部署能动态响应电网需求。该方案基于Vera Rubin DSX参考设计和Conductor平台,已获多家能源企业支持实施。
AWS与TGS达成战略合作,推动能源行业AI与HPC转型
TGS选择AWS作为首选云提供商,利用AWS的高性能计算和生成式AI构建能源勘探解决方案。合作包括现代化TGS Imaging AnyWare平台,部署多模态地下基础模型,并利用AWS Nitro系统确保工作负载安全。
NVIDIA推出物理AI数据工厂蓝图,将计算转化为合成数据
NVIDIA在GTC上发布物理AI数据工厂蓝图,这是一个将计算转化为大规模高质量合成训练数据的开放参考架构。它基于Cosmos世界模型和OSMO操作器,旨在解决真实世界数据难以规模化获取和处理的瓶颈,为下一代自主系统和机器人提供数据引擎。
英伟达联合能源机构展示AI算力工厂参与电网调峰
英伟达与能源研究机构EPRI、英国国家电网及初创公司Emerald AI合作,成功演示了基于Blackwell GPU集群的AI算力工厂如何根据电网实时需求,动态调节自身功耗以充当电网的“减震器”,同时保障高优先级AI工作负载的性能。
ARM Neoverse重塑AI基础设施控制层
ARM推出Neoverse系列基础设施CPU核心,专为云计算、AI和高性能计算优化,被NVIDIA、AWS、Microsoft和Google等厂商采用于其AI平台,实现性能提升和能效改进。该架构推动AI工作负载在云和边缘的高密度部署,强化安全多租户支持。
NVIDIA将GPU动态资源分配驱动捐给Kubernetes社区
NVIDIA将其GPU动态资源分配(DRA)驱动捐献给CNCF,使其成为Kubernetes上游项目。此举旨在将GPU编排的核心控制点从厂商专有层上移至开源社区,并协同多家云厂商推动标准化。