情报
AI 生成的结构化厂商动态简报
思科借Isovalent与VXLAN ESG,将AI网络控制点从K8s移向统一光纤
思科通过整合Isovalent的eBPF技术至Nexus One,实现从Pod到光纤的端到端可视化,并推出基于VXLAN ESG的AI作业分段,将安全与租户隔离策略直接嵌入底层网络。此举旨在解决Kubernetes‘黑箱’导致的AI推理网络瓶颈与故障定位难题。
英特尔 Computex 2026:以 18A 和机架级系统重塑 AI 推理控制权
英特尔发布基于 18A 的 Core Ultra Series 3 和 Xeon 6+(288 e-cores),与 Perplexity 合作推出混合本地推理编排,与 Foxconn 共建机架级 AI 基础设施,与 SambaNova 提供解耦推理云。重点强调 CPU 在 agentic AI 中的编排角色,意图将控制平面从 GPU 转移至 x86。
AWS托管OpenAI GPT-5.5/Codex:控制层从模型转向云平台
AWS在Bedrock上推出OpenAI GPT-5.5、GPT-5.4和Codex编码代理,通过Responses API统一调用。此举将OpenAI前沿模型纳入AWS基础设施,实现数据驻留与容量管理,但用户被锁定在Bedrock生态中。
Cisco Talos威胁狩猎扩展:跨端点、网络与身份域锁定用户生态
Cisco Talos宣布将威胁狩猎服务从端点扩展到Cisco Firewall(网络流量)和Cisco Duo/Identity Intelligence(身份活动),利用AI引擎持续执行假设驱动搜索,通过Cisco Security Cloud Control统一门户交付发现结果。此举旨在捕获低于传统检测阈值的隐蔽攻击信号。
NVIDIA Cosmos 3开源统一物理AI模型,以MoT架构合围GPU生态
NVIDIA发布Cosmos 3,基于Mixture-of-Transformers双塔架构统一物理推理、世界生成与动作生成。开源模型权重、训练脚本和六个合成数据集,但部署优化深度绑定NVIDIA NIM微服务与GPU,意图将物理AI开发生态锁定在其硬件和软件栈上。
Cisco Scale-Across架构:硅光融合定义AI跨数据中心网络新标准
Cisco发布Scale-Across方案,基于Silicon One P200路由系统(51.2Tbps)和400G/800G ZR/ZR+相干光模块,结合开放线路系统,旨在解决AI训练因功率限制需跨数据中心分布时的网络性能问题,实现类似单机房的低延迟无损连接。
Check Point推AEV:以AI代理验证暴露面,应对自主攻击新威胁
Check Point发布Agentic Exposure Validation (AEV),利用AI代理模拟攻击者推理,结合威胁情报与资产上下文,安全证明哪些漏洞真正可被利用。AEV作为CTEM计划关键组件,帮助团队在AI自主攻击时代从被动补丁转向主动验证。
微软Fara1.5浏览器Agent开源权重,72%成功率碾压闭源对手
微软发布Fara1.5系列(4B/9B/27B)浏览器Computer-Use Agent,基于Qwen3.5微调,在Online-Mind2Web达72%成功率,超越OpenAI Operator(58.3%)和Gemini 2.5 CU(57.3%)。开源权重并配套MagenticLite沙盒,但存在视觉提示注入和凭证暴露等安全风险。
Google I/O 2026:Antigravity控制平面重塑AI开发范式,锁定代理编排生态
Google I/O 2026发布Antigravity 2.0桌面应用及CLI/SDK,作为统一代理控制平面,结合Gemini 3.5 Flash/Omni模型、Managed Agents API和AI Studio原生Android支持,旨在将AI开发从原型到生产无缝衔接,但实质是强化对开发者工作流和云资源的绑定。
Google I/O 2026:TPU 8t/8i跨数据中心训练与Gemini 3.5 Flash速度革命
Google发布第八代TPU:TPU 8t(训练)和TPU 8i(推理),原始计算力提升3倍,性能功耗比提升2倍。通过JAX/Pathways实现跨100万+TPU的分布式训练。同时推出Gemini 3.5 Flash,输出速度是其他前沿模型的4倍,并在GDPVal等基准上领先。SynthID被OpenAI、Nvidia等采用。
Google Antigravity 2.0 将控制点从模型API转向Agent编排平台
Google 发布 Antigravity 2.0 桌面应用、Managed Agents API 和 AI Studio 移动端,构建以Agent为中心的开发平台。核心是 Gemini 3.5 Flash 模型,提供4倍速度提升,并深度集成 Google 生态(Android、Firebase、Workspace),试图锁定开发者工作流。
Cloudflare实测Anthropic Mythos:AI漏洞链构建与自动验证突破
Cloudflare在Project Glasswing中测试了Anthropic的Mythos Preview模型,发现其能自动将多个低严重性漏洞链成可利用的PoC,并生成可运行的代码。同时,他们构建了多阶段harness以解决噪声和上下文限制,显著提升漏洞发现质量。
思科用LLM宪法定义取代人工标注,锁定AI安全分类控制权
思科发布Single-Source Safety Definitions,用300+行宪法文档和LLM作为核心评估器,实现AI安全分类一致性。该方法将人工标注压缩为AI驱动,引入意图/内容双轴评估,减少LLM分歧达57倍,并作为Cisco AI Defense产品组合的默认安全分类法。
HPE推自主网络agentic mesh:用AI代理锁定运维控制权
HPE宣布推出基于微服务、自主代理和agentic mesh架构的“自驱动网络”能力,整合至HPE Mist和Aruba Central。该方案号称业界首个完全自主的agentic AIOps网络,可实现实时检测、诊断和修复,无需人工介入。英国司法部案例显示服务台工单减少约75%。
AMD与OpenAI将MRC网络协议贡献给OCP,推进AI网络规模化
AMD与OpenAI、微软等合作,将专为大规模AI训练设计的网络协议MRC(多路径可靠连接)贡献给开放计算项目OCP。AMD不仅是协议规范的共同制定者,其可编程的Pensando DPU/NIC产品已率先实现MRC的部署与验证,旨在将网络从性能瓶颈转变为弹性、可适应的AI基础设施层。
英伟达通过OCP开放MRC协议,推动AI以太网架构标准化
英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC(多路径可靠连接)RDMA传输协议通过开放计算项目(OCP)开放。该协议旨在通过多路径负载均衡和硬件级故障绕过,提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。
微软Copilot Cowork推出移动端与多模型路由,强化AI代理执行层
微软宣布Copilot Cowork新增移动端应用与技能插件,支持跨设备任务流转,并可根据任务类型将工作路由至Claude或OpenAI模型。该更新旨在将Copilot从对话工具转变为跨业务系统的连续执行层。
NVIDIA极端协同设计:用Vera Rubin平台锁定代理AI推理的TCO拐点
NVIDIA发布针对代理系统(Agentic Systems)的极端协同设计架构,包括Vera Rubin NVL72、NVLink 6、ConnectX-9、BlueField-4及Spectrum-X。通过推理解耦、KV缓存管理和低延迟网络,试图解决代理工作负载的高token消耗、长上下文和低延迟矛盾,降低每token成本。
微软与美英政府AI安全机构合作,推动前沿模型评估标准
微软宣布与美国人工智能标准与创新中心及英国人工智能安全研究所达成新协议,将合作测试其前沿模型、评估安全措施,并共同研究对抗性评估、高风险能力评测等AI评估科学。此举旨在通过政府与产业的协作,应对AI带来的国家安全与公共安全风险。
Anthropic联手顶级资本成立新AI服务公司,瞄准中端市场
Anthropic与黑石、Hellman & Friedman、高盛等顶级资本共同成立一家新的AI服务公司,旨在为中型企业提供Claude的深度定制化部署与长期运营支持,以补充其现有的大型企业系统集成商合作伙伴网络。