情报
AI 生成的结构化厂商动态简报
谷歌发布Antigravity平台,加速AI Agent从开发到部署
谷歌在I/O 2026上推出Antigravity 2.0桌面应用及生态,将AI Agent开发平台化,并集成Managed Agents API,旨在消除AI应用从构思到生产部署的基础设施摩擦。
谷歌发布Gemini 3.5系列,定义以代理为中心的AI基础设施新范式
谷歌推出Gemini 3.5系列模型,首款发布3.5 Flash,其核心是作为‘代理优先’的智能体引擎,与Antigravity平台结合,旨在处理企业级长周期、多步骤工作流,标志着AI从辅助工具向可执行复杂任务的生产力系统转变。
Cloudflare与Anthropic合作,为Claude智能体提供云原生执行环境
Cloudflare与Anthropic合作,将Claude Managed Agents的执行层(“手”)与推理层(“脑”)解耦,并集成到Cloudflare开发者平台。此举使企业能在Cloudflare的沙箱、VPC和代理网络中安全、大规模地运行AI智能体代码与工具。
微软开源Conductor:零Token成本的确定性AI Agent编排
微软在开源峰会上发布Conductor,一个用于多智能体AI工作流的开源编排工具。其核心在于通过YAML定义工作流,实现确定性的智能体间路由,并使用Jinja2模板处理条件分支,整个编排层不消耗任何LLM Token。
谷歌发布企业数据向AI Agent演进的五层架构蓝图
谷歌技术博客提出从静态API到基于MCP协议的自主工作流,共五个数据架构演进场景,旨在为企业构建支持AI Agent的“数据层”。这标志着数据访问模式正从人工开发向由AI驱动的、标准化的动态交互范式转变。
谷歌分享数据中心基础设施大规模A/B实验方法论
谷歌公开其数据中心基础设施层进行大规模A/B实验的四大支柱方法,包括机器级实验、平衡设置、二进制密封性和性能指标选择,旨在安全、精准地验证系统级微小优化。
Cloudflare构建AI漏洞发现编排框架,揭示规模化应用路径
Cloudflare通过Project Glasswing项目,测试Anthropic的Mythos Preview等安全LLM,并构建了一套多阶段编排框架(Harness),以规模化、高精度地发现和验证漏洞。该框架通过拆分任务、对抗性验证等方式,解决了AI安全研究中的信号噪声、上下文限制和规模化瓶颈问题。
AI Agent工作负载推动服务器CPU结构性短缺,Arm需求超200亿美元重塑价值链
AI基础设施瓶颈从GPU向CPU转移。Agentic AI推动CPU-GPU配比从1:8向1:1演进。AMD EPYC交付8-12周份额46.2%,Intel部分Xeon配置交付6个月,Arm 3nm 136核AGI处理器需求超200亿美元。CPU成为新瓶颈资源。
NVIDIA CUDA Toolkit堆溢出漏洞暴露GPU云共享模型的根本架构缺陷
Pwn2Own Berlin 2026首次纳入AI/ML类别,NVIDIA CUDA NVVM编译器堆溢出CVE-2026-12839被利用。恶意PTX代码可从GPU驱动逃逸至主机内核,云环境中实现跨租户逃逸。GPU云安全隔离依赖驱动层,此漏洞打破隔离基础假设。
PANW宣称AI加速漏洞发现,自身防火墙零日却在野利用一个月未检出
PANW宣称AI将漏洞发现窗口压缩至3-5个月,但自身PAN-OS零日CVE-2026-0300(CVSS 9.3)在野利用近一个月才披露。4月9日被武器化,5月6日才公开。安全厂商的AI叙事与实际检测能力存在可量化的gap。
Cisco AI基建订单飙至90亿美元,SD-WAN零日却连续三年被同一APT攻破
Cisco Q3 AI基础设施订单目标从50亿上调至90亿美元,单季hyperscaler订单19亿美元。但同期SD-WAN出现CVSS 10.0零日,同一APT组织连续三年利用Cisco零日。AI业务增长与安全工程能力的结构性矛盾正在暴露。
思科与SūmerSports合作,将AI推理基础设施部署于客户本地环境
思科通过其AI POD解决方案,与体育分析平台SūmerSports合作,在NFL球队内部署了完整的本地AI基础设施。此举旨在解决体育行业对数据主权、低延迟和集成复杂性的核心关切,将AI推理能力直接带入数据所在环境。
Google威胁情报揭示UNC6671以身份为中心的攻击与自动化数据窃取
Google威胁情报小组详细披露了UNC6671(BlackFile)组织针对企业云环境的攻击活动。该组织通过精心设计的语音钓鱼和实时中间人攻击绕过MFA,利用自动化脚本大规模窃取Microsoft 365和Okta环境中的数据,凸显了身份层成为新攻击面的严峻现实。
谷歌通过开发者挑战赛推动多模态AI Agent生态构建
谷歌公布Gemini Live Agent挑战赛结果,展示了基于Gemini Live API和Agent Development Kit构建的下一代多模态AI Agent应用。获奖项目覆盖手术辅助、硬件控制、桌面导航等场景,凸显了谷歌通过开发者生态加速AI Agent从文本交互向实时、多模态交互范式转变的战略意图。
Palo Alto Networks发布Idira:PAM扩展至全身份,与Cisco形成Agent身份安全双巨头
Palo Alto Networks在IMPACT大会发布Idira下一代身份安全平台,基于CyberArk 250亿美元收购的PAM技术,将特权访问管理从少数管理员扩展到人类/机器/AI Agent全身份统一管控。核心为Zero Standing Privilege by default和JIT动态权限。机器身份与人类比例达109:1,90%企业遭遇身份入侵,91%企业已在生产跑自主Agent。Idira与Strata、Cortex并列PANW三大核心平台,与Cisco收购Astrix形成Agent身份安全赛道直接竞争。
PwC与Anthropic深化合作,以Claude为核心构建企业级AI代理运营模式
PwC与Anthropic宣布扩大战略联盟,将Claude全面整合至其全球业务。核心是建立联合卓越中心,培训数万名顾问,并围绕Claude Code、Cowork等产品构建“AI原生”的代理技术、交易执行和企业职能重构方案。此举标志着大型咨询机构正从AI试点转向规模化生产部署。
亚马逊Bedrock推出高级提示优化与模型迁移工具
亚马逊在Bedrock服务中推出高级提示优化工具,支持用户通过基于指标反馈循环自动优化提示词,并可同时在最多5个模型上进行测试与迁移评估。该工具整合了Lambda函数、LLM-as-a-Judge和自然语言指导等多种评估方法。
英伟达发布Vera Rubin平台,通过软硬件协同设计解决智能体AI规模化难题
英伟达发布Vera Rubin平台,通过Vera Rubin NVL72 GPU与Groq 3 LPX LPU的异构协同,结合Dynamo编排器,旨在解决智能体AI推理在长上下文、万亿参数MoE模型下的规模化、低延迟与高吞吐挑战。
思科推动服务商将边缘基础设施转型为AI服务平台
思科通过其博客阐述了服务提供商在AI需求驱动下面临的边缘计算新机遇,即利用其大规模分布式网络基础设施,提供包含AI推理、本地数据处理在内的企业服务。思科统一边缘平台旨在解决跨数千个站点的规模化、自动化部署与管理挑战。
思科借SRv6与MRC协议,强化其在AI基础设施网络层的核心地位
思科通过其博客强调,其主导的SRv6网络架构是支撑OpenAI等巨头发布的MRC协议的关键基础。这标志着AI超算网络正从传统ECMP向基于SRv6的确定性、应用驱动架构演进,思科试图将自身定位为这一变革的核心标准制定者和技术提供方。