情报
AI 生成的结构化厂商动态简报
微软构建端到端智能体栈,从芯片到云重构AI应用生态
微软在Build大会上发布了一系列围绕“智能体时代”的基础设施与平台更新,核心在于构建一个从芯片参考设计(Project Solara)、操作系统安全层(MXC/OpenClaw)、数据智能基础(Microsoft IQ)、专用数据库(Azure HorizonDB)到开发与部署平台(Foundry, Copilot app)的完整、集成化智能体技术栈。此举旨在将智能体应用的全生命周期管理收拢至微软生态内部。
思科整合安全堆栈,将网络升级为AI代理时代的核心控制平面
思科在Cisco Live上发布多项安全更新,核心是将网络、身份与安全深度整合以应对AI代理带来的新威胁模型。其动作包括:为基础设施提供运行时补丁防护(Live Protect)、将开源代理安全工具DefenseClaw企业化并集成至Secure Client、扩展Secure Access SSE以跨代理工作流执行零信任控制,并推动基于Cisco Cloud Control的AgenticOps。
英特尔发布Xeon 6+处理器并推动面向智能体AI的机架级基础设施
英特尔在Computex上发布基于18A工艺的Xeon 6+处理器,强调其高能效核心密度。同时,公司联合富士康、SambaNova等合作伙伴,推动为智能体(Agentic)AI推理工作负载优化的新型机架级(Rack-Scale)基础设施,并宣布与Perplexity合作实现混合AI计算。
NVIDIA联合金融巨头推动交易基础模型,重构AI架构范式
NVIDIA联合Revolut、Mastercard、Stripe等金融机构,基于其全栈AI平台(Hopper GPU, Nemotron, NeMo)推出“构建您自己的交易基础模型”开发者示例。该模型旨在通过单一Transformer架构统一处理海量交易数据,替代传统针对单一业务(如欺诈、信用评分)的孤立模型,并已通过AWS、Nebius等云平台及多家服务商进行生态化部署。
Arm与NVIDIA推出RTX Spark,定义智能体AI PC硬件新标准
Arm联合NVIDIA发布基于Arm Grace CPU与Blackwell RTX GPU的RTX Spark平台,旨在为Windows on Arm生态提供高性能本地AI推理能力。该平台采用统一内存架构,目标直指支持下一代自主AI工作流(如agentic RAG),标志着PC从以应用为中心向以智能体为中心的根本性转变。
AWS通过Bedrock集成OpenAI GPT-5.5与Codex,重塑AI模型分发控制点
AWS宣布在Amazon Bedrock平台上全面开放OpenAI的GPT-5.5、GPT-5.4模型及Codex编码代理的访问。企业可通过Bedrock的下一代推理引擎与统一的Responses API调用这些前沿模型,同时满足数据驻留要求并按Token付费。此举将OpenAI的模型能力深度嵌入AWS的AI基础设施层。
Cisco Live 2026开幕:AI Defense个性化Agent安全+自适应红队+Policy Studio+AgenticOps网络自动化
Cisco Live 2026拉斯维加斯开幕Keynote以Lead in the Agentic Era为主题,CEO Chuck Robbins和CPO Jeetu Patel阐述Cisco如何构建、保护和运行人与AI Agent并肩工作的企业。核心发布:AI Defense重大升级——自适应红队测试(用户提供自定义攻击目标,AI自动规划执行多阶段攻击)、Policy Studio(自然语言描述防护策略,上传组织政策文档,agent交互式细化边界)、Agent供应链安全(自动发现代码库/云平台/容器中agent及依赖图,CI/CD集成扫描MCP server/工具/技能漏洞)。平台无关:原生集成Amazon Bedrock AgentCore、Google Agent Development Kit、LangChain,支持NVIDIA NeMo guardrails和OpenShell agent harness。Astrix收购保障API密钥/OAuth token/服务账户等Agent身份安全。AgenticOps实现自主检测变更、分类事件、机器速度执行更新,将多周工单流程缩短至分钟级。Common Policy一次定义全局执行。CCNA v2.0加入AI工具,CCIE Automation加入AI驱动运维。
Google客户案例揭示:企业从LLM API消费转向自有微调开源模型
Trustpilot与Google合作,通过微调Gemma开源模型,在Dataflow和Gemini Enterprise Agent Platform上构建高吞吐量实时数据处理流水线,替代传统ML方案并实现成本可控。此举标志着企业AI策略从依赖闭源API向拥有模型所有权和优化基础设施的范式转变。
微软与英伟达联合推出RTX Spark,将企业级AI算力引入轻薄PC
微软CEO Satya Nadella宣布,将在Windows生态中深度集成NVIDIA RTX Spark架构,旨在为轻薄型PC设备提供本地化、高性能的AI算力(达到petaflop级)和统一内存支持,推动AI工作负载从云端向终端设备迁移。此举标志着个人计算向“AI原生”设备演进的关键一步。
NVIDIA借DSX平台与全球伙伴构建全栈AI云生态,定义AI工厂经济性
NVIDIA正通过其DSX平台与全球云伙伴(如CoreWeave、Firmus、Nebius)深度合作,共同构建由NVIDIA全栈技术定义的‘AI Cloud’生态系统。该生态旨在将‘AI工厂’基础设施贴近数据与用户,并引入‘每Token成本’作为核心经济性指标,以优化从训练、推理到智能体(agentic AI)的全周期工作负载。
NVIDIA发布Vera CPU,为AI代理工作负载定义新设计标准
NVIDIA推出基于自研Olympus核心的Vera CPU,针对AI代理和强化学习工作负载中的‘工具调用-执行’循环进行架构优化。该CPU通过高单核性能、高并发及高效LPDDR5X内存子系统,旨在提升AI工厂中CPU关键路径的性能,从而增加整体AI输出吞吐量和能效。
NVIDIA开源DSX OS,定义AI工厂全栈运营软件层
NVIDIA发布其DSX平台的软件核心DSX OS,这是一套开源、模块化的软件组件,旨在协调从芯片、系统、软件到设施(电力、冷却)的整个AI工厂堆栈。它通过DSX Exchange(MQTT通信枢纽)、MaxLPS(动态功耗管理)、Infra Controller(裸金属生命周期管理)等组件,实现IT/OT深度融合,目标是提升“每瓦特token产出”并降低token成本。
英特尔以Xeon 6+与E835强化CPU在AI基础设施中的控制平面地位
英特尔发布Xeon 6+处理器与Ethernet E835网络适配器,系统性阐述其AI平台战略。核心是将CPU(Xeon)定位为现代AI基础设施的“控制平面”,负责智能体(Agentic)AI工作负载的编排、并发与数据移动,而网络与加速器则作为高效数据平面。此举旨在通过提升能效与系统级协同,应对规模化AI部署的瓶颈。
NVIDIA 发布 DynoSim 仿真框架,将 AI 服务栈优化从硬件试错转向模拟优先
NVIDIA 推出 DynoSim,这是一个基于 Rust 的、全栈离散事件仿真框架,用于对 NVIDIA Dynamo AI 服务栈进行原子级模拟。它通过虚拟时钟和组件化事件队列,将配置搜索和算法研究从昂贵的 GPU 硬件实验转变为快速模拟验证循环,旨在高效探索服务部署的帕累托前沿。
Google推出A2UI开放协议,定义AI Agent原生交互式UI新标准
Google发布A2UI开放协议,允许AI Agent通过JSON描述交互式UI组件,并深度集成至Gemini Enterprise平台。开发者构建的A2A端点Agent可原生渲染日期选择器、地图等丰富控件,无需关心前端框架,由GE或自定义客户端负责安全渲染。
NVIDIA将Step 3.7 Flash多模态模型深度整合至其企业AI全栈
NVIDIA宣布在其加速平台上全面支持StepFun的Step 3.7 Flash模型,这是一个1980亿参数的MoE多模态模型。通过TensorRT-LLM、vLLM进行优化推理,并通过NVIDIA NIM提供生产就绪的容器化微服务部署,同时支持基于NeMo框架的Day 0微调。
Anthropic发布Claude Opus 4.8,以诚实度与代理可靠性重塑企业AI协作模式
Anthropic推出Claude Opus 4.8模型,核心提升在于代理任务(agentic tasks)的端到端可靠性、诚实度及判断力。同步引入‘动态工作流’功能,支持单会话内运行数百并行子代理处理超大规模任务,并提供用户可调的‘努力程度控制’,实现速度、成本与输出质量的精细权衡。
Cloudflare 披露其统一数据平台与 AI 代理架构,展示云原生数据栈闭环
Cloudflare 详细介绍了其内部统一数据平台 Town Lake 与 AI 数据代理 Skipper 的构建。该平台基于 Apache Trino、R2 (Iceberg)、DataHub 等组件,实现了对分散数据的统一 SQL 访问。Skipper 作为 AI 代理,允许用户通过自然语言查询数据,并深度集成于 Cloudflare 自身的产品生态(Workers AI、R2 等)。
Anthropic发布《Zero Trust for AI Agents》安全框架
Anthropic于2026年5月27日发布《Zero Trust for AI Agents》白皮书,系统定义了企业AI Agent部署的安全框架。白皮书提出三条核心原则:永远不信任始终验证、假设已被攻破、最小权限。识别五大Agent特有威胁:提示注入(间接注入通过外部数据源,Microsoft Research确认LLM无法可靠区分信息性上下文和可执行指令)、工具投毒(首个野外恶意MCP服务器已发现)、身份/权限滥用(困惑代理人问题+记忆缓存凭证跨会话提权)、记忆/上下文投毒、供应链攻击。定义六大安全能力域的三级路线图(Foundation/Enterprise/Advanced),其中密码学身份+短命Token被列为Foundation底线——静态API Key即使带轮换策略也视为已被攻破。提出'设计测试':摩擦型措施(速率限制/跳板/短信MFA)对AI攻击者无效,必须优先移除能力而非限流能力。Agentic SOAR为防御运营新范式,几秒内应对AI驱动攻击。
微软发布Fara1.5浏览器Agent模型,72%任务成功率超OpenAI/Google
...