情报
AI 生成的结构化厂商动态简报
AMD发布AI Halo开发平台与Max PRO 400系列处理器,瞄准本地AI代理计算
AMD发布Ryzen AI Halo开发者平台和Ryzen AI Max PRO 400系列处理器,旨在为本地AI代理(Agent)应用提供开发与运行环境。新平台支持高达2000亿参数模型本地运行,并提供高达192GB统一内存,推动AI工作负载从云端向边缘设备迁移。
NVIDIA与Google Cloud深化开发者生态融合,推进AI基础设施与应用栈整合
NVIDIA与Google Cloud联合开发者社区规模超10万人,提供从JAX优化、NVIDIA Dynamo推理优化到AI水印(SynthID)的全栈学习路径。此举旨在通过整合双方底层硬件(Blackwell/Rubin GPU)、云平台(GKE, AI Hypercomputer)与软件框架(Nemotron, Gemma),加速企业级AI应用从原型到生产的落地。
英伟达强调AI智能体评估,推动生产系统标准
英伟达发布技术博客,系统阐述AI智能体与基础模型评估的根本差异,提出以任务成功率、轨迹效率和工具调用准确性为核心的动态评估框架。此举旨在将AI智能体从模型能力测试转向生产系统行为验证,并推广其NeMo Agent Toolkit作为评估工具。
微软发布新一代Surface商用设备,强化端侧AI与安全集成
微软发布新一代Surface Pro和Surface Laptop商用版,搭载英特尔酷睿Ultra Series 3及后续骁龙X2处理器,强调端侧AI推理、安全设计和全栈管理。设备作为Windows AI API和Foundry平台参考硬件,旨在成为企业混合AI战略的硬件基础。
NVIDIA与戴尔发布全栈AI工厂,加速企业级Agentic AI部署
NVIDIA与戴尔深化合作,推出更新版Dell AI Factory with NVIDIA,旨在为企业提供从工作站到数据中心的端到端Agentic AI推理与部署平台。该平台整合了NVIDIA Vera Rubin GPU、Vera CPU、Confidential Computing及Nemotron模型,强调安全、高性能的本地化AI基础设施,以应对激增的AI推理需求。
AWS深化AI代理与多云连接,强化企业现代化与安全
AWS发布多项更新,重点包括将Claude Platform原生集成至AWS账户,推出更强大的EC2 M3 Ultra Mac实例,并扩展AWS Transform AI代理现代化服务至Kiro、Claude等平台。同时,AWS Security Agent新增全仓库代码扫描,AWS Interconnect新增对Oracle Cloud Infrastructure的多云连接支持。
Google 通过 TPU 8 与分布式训练架构强化全栈 AI 控制力
Google 在 I/O 2026 上披露其 AI 基础设施战略核心:发布专为训练和推理优化的 TPU 8t 与 8i 芯片,并实现基于 JAX 和 Pathways 的跨数据中心分布式训练。同时,其年度资本支出预计达 1800-1900 亿美元,以支撑激增的 AI 算力需求。
诺基亚与沃达丰在AWS云上验证核心网功能,推进IoT平台云化
沃达丰与诺基亚成功完成一项试验,将诺基亚的IMS语音核心网和分组数据核心网等关键网络功能部署在AWS云基础设施上,旨在为全球物联网连接平台提供更敏捷的容量扩展能力。
谷歌分享数据中心基础设施大规模A/B实验方法论
谷歌公开其数据中心基础设施层进行大规模A/B实验的四大支柱方法,包括机器级实验、平衡设置、二进制密封性和性能指标选择,旨在安全、精准地验证系统级微小优化。
思科与SūmerSports合作,将AI推理基础设施部署于客户本地环境
思科通过其AI POD解决方案,与体育分析平台SūmerSports合作,在NFL球队内部署了完整的本地AI基础设施。此举旨在解决体育行业对数据主权、低延迟和集成复杂性的核心关切,将AI推理能力直接带入数据所在环境。
Google威胁情报揭示UNC6671以身份为中心的攻击与自动化数据窃取
Google威胁情报小组详细披露了UNC6671(BlackFile)组织针对企业云环境的攻击活动。该组织通过精心设计的语音钓鱼和实时中间人攻击绕过MFA,利用自动化脚本大规模窃取Microsoft 365和Okta环境中的数据,凸显了身份层成为新攻击面的严峻现实。
谷歌通过开发者挑战赛推动多模态AI Agent生态构建
谷歌公布Gemini Live Agent挑战赛结果,展示了基于Gemini Live API和Agent Development Kit构建的下一代多模态AI Agent应用。获奖项目覆盖手术辅助、硬件控制、桌面导航等场景,凸显了谷歌通过开发者生态加速AI Agent从文本交互向实时、多模态交互范式转变的战略意图。
PwC与Anthropic深化合作,以Claude为核心构建企业级AI代理运营模式
PwC与Anthropic宣布扩大战略联盟,将Claude全面整合至其全球业务。核心是建立联合卓越中心,培训数万名顾问,并围绕Claude Code、Cowork等产品构建“AI原生”的代理技术、交易执行和企业职能重构方案。此举标志着大型咨询机构正从AI试点转向规模化生产部署。
亚马逊Bedrock推出高级提示优化与模型迁移工具
亚马逊在Bedrock服务中推出高级提示优化工具,支持用户通过基于指标反馈循环自动优化提示词,并可同时在最多5个模型上进行测试与迁移评估。该工具整合了Lambda函数、LLM-as-a-Judge和自然语言指导等多种评估方法。
英伟达发布Vera Rubin平台,通过软硬件协同设计解决智能体AI规模化难题
英伟达发布Vera Rubin平台,通过Vera Rubin NVL72 GPU与Groq 3 LPX LPU的异构协同,结合Dynamo编排器,旨在解决智能体AI推理在长上下文、万亿参数MoE模型下的规模化、低延迟与高吞吐挑战。
思科推动服务商将边缘基础设施转型为AI服务平台
思科通过其博客阐述了服务提供商在AI需求驱动下面临的边缘计算新机遇,即利用其大规模分布式网络基础设施,提供包含AI推理、本地数据处理在内的企业服务。思科统一边缘平台旨在解决跨数千个站点的规模化、自动化部署与管理挑战。
思科借SRv6与MRC协议,强化其在AI基础设施网络层的核心地位
思科通过其博客强调,其主导的SRv6网络架构是支撑OpenAI等巨头发布的MRC协议的关键基础。这标志着AI超算网络正从传统ECMP向基于SRv6的确定性、应用驱动架构演进,思科试图将自身定位为这一变革的核心标准制定者和技术提供方。
微软通过驱动程序质量倡议强化Windows平台控制
微软在WinHEC 2026上推出驱动程序质量倡议,旨在通过四大支柱——架构、信任、生命周期和度量——系统性提升驱动程序的可靠性、安全性和性能。此举标志着微软正加强对Windows硬件生态系统的技术规范与控制,以提升最终用户体验。
NVIDIA通过cuPyNumeric与GDS加速科学计算工作流
NVIDIA展示了其XANI工作流,利用cuPyNumeric分布式计算库与GPUDirect Storage,将量子材料X射线分析的计算时间从9个月缩短至4小时。这标志着GPU加速正从训练/推理向科学计算与实时数据处理的端到端工作流渗透。
思科在ONUG 2026提出AI数据中心网络与安全融合架构
思科在ONUG 2026峰会上,围绕AI Agentic时代的数据中心,系统阐述了其融合网络与安全的AI原生基础设施蓝图。其核心是通过将安全策略(如防火墙、微分段)卸载至DPU,并利用AI驱动的运维模型,解决AI工作负载对网络性能与安全隔离的双重苛刻需求。