情报
AI 生成的结构化厂商动态简报
微软发布Fara1.5浏览器Agent模型,72%任务成功率超OpenAI/Google
...
思科发布内部RAG平台DRIFT,展示企业AI基础设施蓝图
思科IT部门推出名为DRIFT的文档检索与摄取框架工具包,旨在标准化和规模化企业内部RAG应用开发流程。该平台基于云原生微服务架构,运行在思科自有的AI POD基础设施上,提供从文档预处理到检索重排的端到端流水线,并支持Agentic RAG等演进用例。
思科调整漏洞披露策略,基于AI与风险优先级
思科宣布将调整其基于风险的漏洞披露模型,利用AI能力加速漏洞发现,并优先披露高风险漏洞的详细技术信息。对于内部发现且风险较低的漏洞,将减少独立披露,转而引导客户采用包含安全补丁的软件版本。
NVIDIA 开源医学图像生成框架,推动 3D 医疗 AI 数据瓶颈突破
NVIDIA 发布并开源了基于 MAISI-v2 (Latent Rectified Flow) 架构的 NV-Generate-CTMR 框架及其新模型 NV-Generate-MR-Brain。该框架旨在规模化生成高质量的 3D CT 和 MRI 合成数据,并配套发布了大规模开源多模态 MRI 数据集 MR-RATE,以解决医疗 AI 开发中的数据稀缺和隐私限制问题。
Google Cloud展示垂直行业AI Agent架构,强调混合集成能力
Google Cloud通过客户案例Movix,展示了为牙科制造业构建的端到端AI Agent解决方案。该方案基于Google Cloud基础设施,利用定制模型和Gemini Enterprise Agent Platform,并重点设计了连接本地遗留系统的混合架构,以进入保守市场。
Fortinet扩展FortiGate G系列:3500G(400Gb)+400G,原生Shadow AI检测+MCP流量检查
Fortinet扩展FortiGate G系列,发布3500G(400Gb连接,数据中心级)和400G(企业边缘);原生Shadow AI检测+FortiOS 8.0 MCP/Agent间流量检查。硬件级验证信任+安全启动应对AI推理工作负载加密流量挑战。
Microsoft开源RAMPART+Clarity:AI Agent安全测试框架与设计验证工具
Microsoft开源两个AI安全工具:RAMPART(Agent红队测试框架,将攻防场景编码为可重复CI测试)和Clarity(结构化设计验证工具,多AI视角审查架构假设)。RAMPART支持将单个CVE发现转化为全行业回归覆盖。
Google I/O 2026全面押注Agentic AI:Gemini 3.5 Flash/Omni/Antigravity 2.0/Gemini Spark密集发布
Google I/O 2026发布Gemini 3.5 Flash(4倍输出速度+前沿智能)、Gemini Omni Flash(原生多模态视频生成)、Antigravity 2.0(Agent编排桌面平台+CLI+SDK)、Gemini Spark(24/7个人AI助手)。Gemini MAU从4亿增至9亿;资本开支2026年预计1800-1900亿美元(2022年的6倍)。
NVIDIA 以智能体工具包推动 AI 工作流从模型调用向编排平台演进
NVIDIA 通过其 NeMo Agent Toolkit 开源库,展示了一个用于量化金融信号发现的多智能体系统参考架构。该系统将传统手动、碎片化的研究流程,转变为由配置驱动、具备可观测性的自动化闭环,凸显了智能体编排层在复杂 AI 应用中的核心价值。
NVIDIA开源GPU Usage Monitor,简化Kubernetes集群GPU监控
NVIDIA发布开源项目GPU Usage Monitor,通过一个预集成的Helm Chart,将DCGM Exporter、kube-state-metrics、Prometheus和Grafana打包部署,为Kubernetes集群中的GPU资源提供开箱即用的实时监控能力。此举旨在解决AI工作负载在K8s环境中GPU利用率不透明、资源调度盲点等运营难题。
思科与Qumulo验证统一数据平台架构,瞄准AI与混合负载
思科通过博客与白皮书,验证了其UCS M8机架服务器与Qumulo数据平台的集成方案。该方案旨在为AI、企业应用等混合工作负载提供统一、可扩展的文件与对象存储,并通过Cisco Intersight实现集中管理,以应对数据碎片化挑战。
NVIDIA在COMPUTEX展示Vera Rubin NVL72等AI基础设施创新
NVIDIA在COMPUTEX 2026上获得多项最佳选择奖,其Vera Rubin NVL72机柜级AI超算、Jetson Thor边缘平台及Alpamayo自动驾驶开放平台获奖,展示了其在AI工厂、边缘推理和物理AI领域的基础设施布局。
BadHost漏洞(CVE-2026-48710):Starlette单字符绕过认证,全球AI Agent基础设施面临暴露风险
安全机构X41 D-Sec在OSTIF资助的vLLM审计中发现Starlette框架认证绕过漏洞CVE-2026-48710(BadHost)。根因:Starlette用HTTP Host头拼接重建request.url时未验证Host值合法性——注入/、?或#字符可导致request.url.path与ASGI路由的scope[path]产生解析不一致,path-based认证中间件被欺骗放行受保护资源。MCP Server特别高危:MCP规范要求/.well-known/oauth-authorization-server等Discovery端点默认公开,为攻击者提供最可靠的Host头注入路径。X41 D-Sec扫描发现生物制药临床试验数据库、企业邮箱完整访问权、AWS云拓扑、身份验证公司PII、工业设备堡垒机SSH等生产系统暴露。Starlette 1.0.1(5月21日)已修复,但3个月补丁周期(2月发现→5月发布)和间接依赖链导致大量部署仍受影响。X41评级CVSS 7.0(High),Starlette维护者评级6.5(Moderate)——分歧在于path-based auth是否为anti-pattern。
思科通过MCP与Agentic Workflows构建AI原生网络控制平面
思科在Cisco Live 2026上系统展示其网络平台产品组合(Meraki、Catalyst Center)如何通过MCP(模型上下文协议)和Agentic Workflows,将AI代理深度集成到网络自动化与运维中,实现从意图到执行的闭环。
思科全面拥抱SONiC,提供从硬件到软件的全栈开放网络方案
思科宣布在其Cisco 8000和即将推出的N9000系列交换机上全面支持开放网络操作系统SONiC,并提供构建自有发行版和预构建镜像两种消费模式。此举旨在将思科硅芯片性能与SONiC的开放架构相结合,为AI和高性能工作负载提供可编程、可扩展的网络基础设施。
思科Talos IR分享AI生成报告一致性控制方法
思科Talos事件响应团队发布研究,识别AI生成技术报告中的四类不一致问题,并通过提示工程方法进行控制。该研究基于桌面演练报告案例,旨在提升AI辅助内容生成的可靠性与效率。
Google将AI Studio与云数据库及Firebase深度集成,降低全栈应用开发门槛
Google宣布AI Studio与Google Cloud的集成更新,支持开发者通过自然语言提示,一键将全栈应用部署至Cloud Run,并自动配置Firestore、Cloud SQL数据库及Firebase Auth身份验证。此举旨在通过零成本启动和AI代理驱动的数据库选择,显著降低应用原型开发与部署的初始摩擦。
谷歌发布Antigravity 2.0,定义AI Agent本地开发控制平面
谷歌在I/O 2026上推出Antigravity 2.0,这是一个独立的桌面应用,旨在成为构建、测试和编排复杂AI工作流的“Agent-First”本地控制平面。它通过CLI/SDK、动态子代理和与企业云安全环境的直接集成,将AI Agent的开发与部署流程从云端延伸至本地环境,试图统一AI应用生命周期管理。
思科阐述其AI就绪安全网络架构战略
思科在Gartner魔力象限报告中重申其网络战略,核心是将有线与无线网络统一为平台,并深度集成AI驱动的运营(AgenticOps)与安全。该战略旨在构建一个能够感知、推理、行动并验证的端到端网络架构,以应对AI工作负载带来的新流量模式与安全挑战。
思科通过芯片层智能包流重塑AI数据中心网络架构
思科推出基于Silicon One G300芯片的智能包流技术,将网络从高速传输层转变为具备感知、适应和优化能力的智能系统,以应对大规模AI工作负载。该技术通过硬件级遥测、自适应路由和拥塞管理,显著提升AI集群的集体完成时间和GPU利用率。