情报
AI 生成的结构化厂商动态简报
微软构建端到端智能体栈,从芯片到云重构AI应用生态
微软在Build大会上发布了一系列围绕“智能体时代”的基础设施与平台更新,核心在于构建一个从芯片参考设计(Project Solara)、操作系统安全层(MXC/OpenClaw)、数据智能基础(Microsoft IQ)、专用数据库(Azure HorizonDB)到开发与部署平台(Foundry, Copilot app)的完整、集成化智能体技术栈。此举旨在将智能体应用的全生命周期管理收拢至微软生态内部。
思科发布端到端AI网络战略,整合eBPF与VXLAN ESG应对推理时代
思科发布端到端AI网络战略,通过将Isovalent的eBPF技术整合至Nexus One,实现Kubernetes容器与物理网络的无缝可视性与策略同步。同时,思科推出基于VXLAN端点安全组(ESG)的AI作业细粒度隔离,并扩展其AI Canvas和Live Protect能力,以应对规模化AI推理与前沿AI模型带来的安全挑战。
思科整合安全堆栈,将网络升级为AI代理时代的核心控制平面
思科在Cisco Live上发布多项安全更新,核心是将网络、身份与安全深度整合以应对AI代理带来的新威胁模型。其动作包括:为基础设施提供运行时补丁防护(Live Protect)、将开源代理安全工具DefenseClaw企业化并集成至Secure Client、扩展Secure Access SSE以跨代理工作流执行零信任控制,并推动基于Cisco Cloud Control的AgenticOps。
谷歌发布GCS MCP服务器,将非结构化数据无缝接入AI代理工作流
谷歌推出Google Cloud Storage (GCS) MCP服务器,支持远程托管和本地开源两种模式。该服务器基于Model Context Protocol (MCP)标准,旨在将存储在GCS中的非结构化数据(如文档、日志)直接转化为AI代理可用的上下文,并内置IAM、审计日志和Model Armor等企业级安全控制。
GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能
NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。
Arm与NVIDIA推出RTX Spark,定义智能体AI PC硬件新标准
Arm联合NVIDIA发布基于Arm Grace CPU与Blackwell RTX GPU的RTX Spark平台,旨在为Windows on Arm生态提供高性能本地AI推理能力。该平台采用统一内存架构,目标直指支持下一代自主AI工作流(如agentic RAG),标志着PC从以应用为中心向以智能体为中心的根本性转变。
Oracle Cloud加入Arm AGI CPU生态,Arm架构加速夺取AI基础设施控制层
Oracle Cloud Infrastructure宣布加入Arm AGI CPU生态系统,将基于Arm架构的优化CPU引入其云平台以支持Agentic AI工作负载。这一动作进一步验证了Arm Neoverse平台在云数据中心,特别是AI基础设施中替代传统x86架构的趋势。
NVIDIA GTC台北2026:Vera 88核CPU专为智能体设计,1.8倍x86性能,OpenAI/Anthropic首批部署
NVIDIA在GTC台北2026发布首款独立数据中心微处理器Vera,首次以自有CPU直接对标Intel Xeon和AMD EPYC。Vera采用88个定制Olympus Arm核心,单片mesh网络(非chiplet),核心间通信比传统CPU快50%。LPDDR5X带宽1.2TB/s,PCIe Gen6,内外带宽为同类最高性能CPU的2-3倍。智能体沙箱性能1.8倍x86。首批客户:OpenAI、Anthropic、SpaceX。Q3 2026投产,FY CPU收入目标200亿美元。标志着NVIDIA从GPU加速器厂商向全栈数据中心平台厂商的战略跃迁。
NVIDIA联合台系制造巨头,以AI平台重构制造业运营与控制层
NVIDIA联合台积电、富士康、广达等超过500家生态伙伴,在其Vera Rubin NVL72 AI基础设施生产过程中,深度应用CUDA-X、Omniverse、AI代理及物理AI技术,优化从芯片设计、工厂规划到产线运营的全流程。此举将NVIDIA的技术栈从计算加速延伸至制造运营的核心控制层。
微软与英伟达共推基于Arm架构RTX Spark的Windows平台,瞄准本地AI智能体与工作站
微软与英伟达宣布深度整合,推出基于全新Arm架构RTX Spark芯片的Windows PC与工作站。该平台通过高达128GB统一内存、1 petaflop AI算力及Windows系统层优化,旨在将前沿AI模型与智能体(agent)工作负载从云端迁移至本地设备运行。
NVIDIA开源DSX OS,定义AI工厂全栈运营软件层
NVIDIA发布其DSX平台的软件核心DSX OS,这是一套开源、模块化的软件组件,旨在协调从芯片、系统、软件到设施(电力、冷却)的整个AI工厂堆栈。它通过DSX Exchange(MQTT通信枢纽)、MaxLPS(动态功耗管理)、Infra Controller(裸金属生命周期管理)等组件,实现IT/OT深度融合,目标是提升“每瓦特token产出”并降低token成本。
NVIDIA RTX Spark发布:AI PC时代的开启
NVIDIA在Computex 2026正式发布RTX Spark——首款面向AI Agent时代的Windows PC超级芯片。该芯片基于TSMC 3nm工艺,整合Blackwell架构GPU(6144 CUDA核心+第五代Tensor Core,FP4精度)与20核Grace CPU,通过NVLink-C2C互联(600GB/s),提供1 petaflop AI算力和最高128GB统一LPDDR5X内存(300GB/s带宽)。笔记本最薄14mm、最轻3磅,支持本地运行1200亿参数大模型。NVIDIA与微软合作推出OpenShell运行时和Windows安全原语,Adobe正在为RTX Spark重新架构Photoshop和Premiere。首批设备秋季上市,来自ASUS、Dell、HP、Lenovo、Microsoft Surface、MSI,Acer和GIGABYTE随后跟进。预计售价$3000-4000。RTX Spark路线图延伸至2030年:2027年升级Vera CPU+Rubin GPU+LPDDR6,2029-2030年Rosa CPU+Feynman GPU。这是继2020年Apple M1之后PC行业最大的架构变革信号。
NVIDIA 发布 DynoSim 仿真框架,将 AI 服务栈优化从硬件试错转向模拟优先
NVIDIA 推出 DynoSim,这是一个基于 Rust 的、全栈离散事件仿真框架,用于对 NVIDIA Dynamo AI 服务栈进行原子级模拟。它通过虚拟时钟和组件化事件队列,将配置搜索和算法研究从昂贵的 GPU 硬件实验转变为快速模拟验证循环,旨在高效探索服务部署的帕累托前沿。
思科以智能建筑数据平台为枢纽,整合企业网络与楼宇运营
思科在博客中阐述其“智能建筑”战略,核心是将企业网络、协作与楼宇管理系统数据通过Cisco Spaces等平台进行整合,实现基于实时占用数据的能源与空间优化。此举标志着网络基础设施的角色从连接层向企业运营数据控制层扩展。
NVIDIA Vera CPU交付四大AI实验室,Computex前夕N1X+硅光子学三线并发
NVIDIA于5月18日宣布Vera CPU首批交付Anthropic、OpenAI、SpaceX AI和Oracle Cloud Infrastructure,由超大规模计算副总裁Ian Buck亲自送货。Vera是NVIDIA首款专为Agent式AI设计的CPU,88颗自研Olympus核心(Arm v9.2),LPDDR5X带宽1.2TB/s,Phoronix基准测试单核超越AMD EPYC 9575F和Intel Xeon 6980P,Linux内核编译仅20秒。同日NVIDIA+微软+Arm联合发布神秘海报预告N1X笔记本处理器(Blackwell GPU+20核联发科Arm CPU+128GB统一内存),Dell/Lenovo/ASUS已准备设备。此外NVIDIA三个月内向硅光子学投资至少$65亿(Lumentum/Coherent/Marvell各$20亿+Corning $5亿+Ayer Labs E轮$5亿),黄仁勋称硅光产能需求远超全球供给,CPO 2026渗透率0.5%→2030年35%。
Anthropic发布Claude Opus 4.8,以诚实度与代理可靠性重塑企业AI协作模式
Anthropic推出Claude Opus 4.8模型,核心提升在于代理任务(agentic tasks)的端到端可靠性、诚实度及判断力。同步引入‘动态工作流’功能,支持单会话内运行数百并行子代理处理超大规模任务,并提供用户可调的‘努力程度控制’,实现速度、成本与输出质量的精细权衡。
NVIDIA以游戏捆绑订阅深化云游戏市场,凸显AI基础设施复用策略
NVIDIA通过GeForce NOW平台发布新游戏《007 First Light》,并将其与12个月Ultimate会员订阅捆绑销售。此举旨在利用其强大的云端RTX GPU算力(包括RTX 50系列)吸引并锁定用户,同时展示了其底层AI基础设施向消费级云游戏服务的能力复用。
Google 通过加速器项目在 MENA-T 区域系统性培育 AI 原生应用生态
Google 宣布了其 MENA-T 区域创业加速器的新一期 15 家初创公司名单,这些公司均为 AI-First 企业,覆盖医疗、教育、制造、安全等多个垂直领域。该计划提供包括 AI 安全、生成式设计在内的技术指导,并深度整合 Google Cloud 的 AI 基础设施(如 Gemini Enterprise Agent Platform, BigQuery, GKE),旨在将区域创新绑定至 Google 的 AI 技术栈。
微软响应《Take It Down Act》,跨消费者服务部署NCII哈希检测与统一举报流程
微软宣布强化对非自愿亲密图像(NCII,含AI生成内容)的治理。核心动作包括:优化全球举报流程表单,统一处理真实与合成图像;并将在Teams Free、OneDrive、Xbox等消费者服务中,扩展使用来自StopNCII.org的已验证图像哈希进行主动检测与移除。此举直接响应美国《Take It Down Act》生效,旨在提升处理速度与跨平台协同。
Cloudflare 披露其统一数据平台与 AI 代理架构,展示云原生数据栈闭环
Cloudflare 详细介绍了其内部统一数据平台 Town Lake 与 AI 数据代理 Skipper 的构建。该平台基于 Apache Trino、R2 (Iceberg)、DataHub 等组件,实现了对分散数据的统一 SQL 访问。Skipper 作为 AI 代理,允许用户通过自然语言查询数据,并深度集成于 Cloudflare 自身的产品生态(Workers AI、R2 等)。