情报
AI 生成的结构化厂商动态简报
AMD提出AI基础设施网络架构新范式:从无损网络转向智能端点
AMD发布博客,提出构建大规模AI基础设施的七个关键问题,核心观点是传统无损以太网或InfiniBand架构存在成本与复杂性瓶颈。其主张将网络智能和可靠性功能从昂贵的专用交换机转移到智能网卡(NIC)上,在标准(可能有损)以太网上实现可靠传输,以降低总拥有成本并简化运营。
英特尔与ChatPPT合作推出混合AI PC版,推动AI工作负载本地化
英特尔与AI应用ChatPPT合作,利用其AI Super Builder技术推出混合AI PC版。该版本将部分AI工作负载(如格式调整)从云端卸载至本地PC处理,降低了50%的云成本并提升了32%的用户使用时长,同时增强了数据隐私。
微软定义“智能体计算时代”,将AI基础设施与智能体平台作为核心战略
微软CEO在财报后明确将“从终端用户驱动的工作负载转向由终端用户和智能体共同驱动的工作负载”视为改变整个技术栈的平台迁移。公司战略聚焦于建设领先的AI基础设施与智能体平台,并已将其AI业务年化收入推升至370亿美元。
谷歌财报揭示企业AI堆栈战略,推动代理与推理基础设施增长
谷歌Q1财报显示其全栈AI战略成效显著,云业务因AI产品需求激增,收入增长63%。关键信号包括:推出Gemini Enterprise Agent Platform,代理数据处理量激增(330个客户年处理超万亿tokens),并计划将TPU硬件直接部署至客户数据中心。
思科借硬件更新周期推动AI就绪数据中心架构
思科通过博客指出,企业AI战略受阻的核心在于数据中心基础设施。其主张将AI就绪性融入常规硬件更新周期,强调通过统一运营、网络内嵌安全、端到端可观测性及高性能网络来构建AI基础设施。
Arm发布Performix性能分析工具包,瞄准AI Agent时代优化
Arm发布免费性能分析工具包Performix,旨在为AI Agent开发提供跨Arm平台的统一性能洞察与优化。该工具通过Arm MCP Server集成至主流AI开发环境,将硬件运行时数据转化为可操作的优化建议,并已获得微软、MongoDB等生态伙伴支持。
英伟达内部规模化部署GPT-5.5驱动AI代理,定义企业AI基础设施新范式
英伟达宣布其超过1万名员工已通过Codex应用,在基于GB200 NVL72的NVIDIA基础设施上规模化使用GPT-5.5。此举不仅展示了前沿模型推理在企业内部工作流中实现‘变革性’生产力的技术可行性,更通过专用的安全云VM架构,为企业部署AI代理提供了可审计、隔离的参考范式。
思科将网络定位为AI基础设施的能源控制层
思科通过其博客阐述了能源正成为AI规模化的关键瓶颈,并展示其正为一家欧洲银行设计下一代AI数据中心。思科强调网络在融合数字与能源系统中的作用,将其视为提供能见度、协调和安全性的控制层,以管理AI工作负载的能源、冷却和空间约束。
NVIDIA与Google Cloud深化合作,构建面向AI工厂与物理AI的云基础设施
NVIDIA与Google Cloud宣布合作升级,推出基于Vera Rubin和Blackwell GPU的新实例,旨在构建支持近百万GPU集群的“AI工厂”,并整合Gemini、Nemotron等模型平台,加速从智能体到物理AI(如机器人、数字孪生)的生产级部署。
Google发布Gemini企业级代理平台,定义AI代理时代技术栈
Google在Next '26上发布Gemini企业级代理平台,提供构建、扩展、治理和优化AI代理的端到端解决方案。该平台整合了新的AI基础设施、数据云、安全防御和任务执行能力,旨在将企业流程统一为单一智能工作流。
NVIDIA联手Adobe与WPP,以OpenShell为核心构建企业级AI代理安全架构
NVIDIA深化与Adobe、WPP的战略合作,旨在将智能AI代理置于企业营销运营的核心。其关键动作是推出并强调NVIDIA OpenShell安全运行时,为运行多步工作流的AI代理提供基于策略的、可审计的隔离执行环境。这标志着从单纯的功能性AI向受控、可信的企业级AI代理架构演进。
思科携手英伟达,将网络升级为AI媒体处理的控制平面
思科与英伟达深化合作,推出基于开放标准MXL的验证设计方案。该方案将思科IP媒体架构与英伟达Holoscan平台整合,使网络从传输层演变为支持实时AI推理的主动处理层,为广电行业实现低延迟、多语言的实时AI媒体生产。
微软提前启用Fairwater超大规模AI数据中心,定义AI基础设施新标准
微软宣布其位于威斯康星州的Fairwater数据中心提前投入运营。该中心被定位为全球最强大的AI数据中心,集成了数十万个NVIDIA GB200 GPU,通过大规模光纤互连构成单一无缝集群,旨在为下一代AI模型训练和推理提供前所未有的算力规模。
英伟达推动AI基础设施评估指标从FLOPS转向每token成本
英伟达提出应将“每token成本”而非“每美元FLOPS”作为评估AI基础设施的核心经济指标。这标志着从衡量计算输入转向衡量商业输出,涉及硬件、软件、网络的全栈优化,以降低企业AI推理的总拥有成本。
思科以自身实践验证AI本地化部署的安全与成本逻辑
思科客户体验(CX)部门通过部署基于UCS服务器和Nexus交换机的本地AI基础设施,处理敏感客户数据,以应对云上数据主权和推理成本不可预测的挑战。此举展示了将AI工作负载从可变运营成本转向确定性资本投资的架构选择。
英特尔与谷歌深化合作,共同定义异构AI基础设施核心
英特尔与谷歌宣布多年期合作,旨在共同推进下一代AI与云基础设施。核心是强化CPU和定制IPU在异构AI系统中的中心地位,通过多代Xeon处理器优化性能与能效,并扩展基于ASIC的IPU联合开发,以提升超大规模AI环境下的效率与可预测性。
英特尔与谷歌深化合作,共推CPU与IPU异构AI基础设施
英特尔与谷歌宣布多年期合作,旨在通过多代至强处理器和联合开发定制IPU,共同推进下一代AI与云基础设施。此举强化了CPU在AI系统编排与数据处理中的核心作用,以及IPU在卸载网络、存储任务以提升超大规模AI环境效率的关键价值。
思科MWC 2026展示融合S/NOC与代理式AI,推进自主安全运营
思科在MWC 2026上运行了融合安全与网络运营中心,展示了其安全云、XDR与Splunk平台的无缝集成。核心是通过代理式AI生成“即时攻击故事板”,辅助分析师进行事件分级和调查,并将工作流程自动化桥接至Splunk Enterprise Security进行深度威胁狩猎。
英特尔与SambaNova联合发布面向Agentic AI的异构推理架构
英特尔与SambaNova宣布合作,为Agentic AI生产负载设计异构计算蓝图。该方案结合GPU、SambaNova RDU和英特尔至强6处理器,旨在解决性能、效率与软件兼容性挑战,预计2026年下半年推出。
思科深化与Nutanix合作,将超融合架构扩展至AI及边缘
思科宣布与Nutanix合作的多项进展,核心是将Nutanix云平台集成到思科AI POD、统一边缘及FlashStack架构中,旨在为从核心到边缘的AI和传统工作负载提供统一的、经过验证的部署蓝图与运营模型。