LLM - AI基础设施情报搜索

Cloudflare 其他 2026-06-08

Cloudflare 将实时威胁情报嵌入 WAF，控制点从人工转向自动化引擎

Cloudflare 发布新集成，允许用户基于 Cloudforce One 的实时威胁情报（IP、攻击者、目标行业等）直接编写 WAF 规则。采用 always-on 检测框架，以 O(1) 常数时间查找实现微秒级延迟，目前仅支持 IP 匹配，未来将扩展至 JA3 指纹和域名。

NVIDIA 其他 2026-06-04

NVIDIA Nemotron 3 Ultra：以MoE与MOPD重构AI Agent控制平面，锁定企业推理成本

NVIDIA发布**Nemotron 3 Ultra**，一个550B参数MoE模型（55B活跃），专为AI Agent编排而设计。通过**多教师在线策略蒸馏（MOPD）** 与**Hybrid Mamba-Transformer**架构，其在**SWE-bench**等任务中实现5倍吞吐量提升与30%成本节省，标志着推理控制权从单一模型向分层Agent系统的转移。

Cisco 其他 2026-06-03

思科Silicon One扩展至校园：以芯片内嵌控制锁定Agentic AI网络

思科宣布将Silicon One芯片用于校园网络，推出C9550/C9350系列智能交换机，配合Cloud Control平台，实现分布式可见性、持续高性能和自适应可编程。通过深度片上缓冲、身份感知转发和亚秒级策略更新，意图将控制平面从外围设备转移至芯片和云原生编排，以应对AI代理带来的持续流量和安全挑战。

Cisco 其他 2026-06-03

思科Agent Gateway：零信任从访问控制升级为AI代理行动控制

思科发布Secure Access Agent Gateway，将零信任策略从传统的用户/设备访问控制扩展到AI代理的细粒度行动控制。通过Duo识别代理身份，在LLM、MCP工具、SaaS API等交互点实施策略，实现行动级审计和凭证注入，旨在解决代理自主行动带来的新安全风险。

NVIDIA 其他 2026-06-02

NVIDIA DGX Spark更新：一键部署本地AI代理，多节点集群扩展至400B模型

NVIDIA在Computex 2026发布DGX Spark软件更新，包括NemoClaw一键安装本地AI代理、Qwen3.6-35B模型在vLLM上实现2.6倍性能提升、以及Sync集群助手支持2-4节点通过ConnectX-7 200Gbps RoCE高速互联，使本地运行大规模自主代理和多节点分布式推理成为可能。

Google 其他 2026-06-01

AlloyDB Remote MCP Server GA：Google Cloud以开放协议重塑AI代理数据访问生态

Google Cloud宣布AlloyDB Remote MCP Server正式GA，允许AI代理通过HTTP端点安全访问操作型数据。该服务基于开放MCP协议，提供IAM细粒度授权、Model Armor防护和审计日志，并集成AlloyDB的ScaNN向量索引（10亿+向量，6倍速度）与AI函数，旨在成为企业AI代理的单一数据源。

NVIDIA 其他 2026-06-01

NVIDIA Cosmos 3开源统一物理AI模型，以MoT架构合围GPU生态

NVIDIA发布Cosmos 3，基于Mixture-of-Transformers双塔架构统一物理推理、世界生成与动作生成。开源模型权重、训练脚本和六个合成数据集，但部署优化深度绑定NVIDIA NIM微服务与GPU，意图将物理AI开发生态锁定在其硬件和软件栈上。

NVIDIA 其他 2026-06-01

NVIDIA RTX Spark：以SoC形态夺取PC控制权，AI算力革命或锁定生态

NVIDIA发布RTX Spark SoC，集成Blackwell GPU与20核Grace CPU（MediaTek设计），通过NVLink-C2C实现600GB/s互联，最高128GB统一内存，1 petaflop FP4 AI算力，支持本地运行1200亿参数大模型。此举从GPU供应商跃升为整机方案商，直接挑战Apple M系列、Qualcomm及x86阵营。

Google 其他 2026-05-29

Google发布A2UI开放协议：以JSON描述UI，重塑AI代理交互生态

Google推出A2UI开放协议，允许AI代理通过JSON payload描述交互式UI（如日期选择器、地图），并在Gemini Enterprise中原生渲染。该协议与A2A、Flutter等集成，旨在解决代理仅返回文本的局限性，同时避免HTML注入风险。

NVIDIA 其他 2026-05-29

DynoSim: Simulating the Pareto Frontier

...

Anthropic 其他 2026-05-27

Anthropic发布AI Agent零信任框架，重新定义Agent安全边界

Anthropic发布业界首份《Zero Trust for AI Agents》白皮书，系统定义AI Agent安全原则、五大特有威胁（提示注入、工具投毒、身份滥用等）及六大能力域三级路线图，标志着AI安全从网络边界防护转向Agent行为与身份监控。

Cisco 其他 2026-05-26

思科全栈PQC交换机：以硬件信任锚锁定量子安全控制点

思科发布C9000 Smart Switches，业界首款支持全栈后量子密码学（PQC）的企业交换机。通过FPGA内嵌的**Trust Anchor模块（TAm）**实现量子抗性安全启动，并在**IOS XE**中集成**ML-KEM**算法强化**SSH、MACsec、IPsec、TLS**密钥交换，旨在防御“先收后解”量子威胁，但未公开性能开销数据。

Other 其他 2026-05-22

BadHost漏洞暴露Starlette认证绕过，全球AI Agent基础设施面临HTTP走私风险

BadHost漏洞(CVE-2026-48710)利用Starlette ASGI框架中request.url.path与scope[path]的不一致，通过Host头注入实现认证绕过。该漏洞影响FastAPI、vLLM、MCP Server等40万+仓库，使SSE/HTTP传输模式的AI Agent服务器直接暴露，可导致数据泄露乃至RCE。

Google 其他 2026-05-21

Google AI Studio一键部署全栈应用：AI代理接管云资源编排

Google在I/O 2026宣布AI Studio与Cloud Run、Firestore、Cloud SQL深度集成，用户无需账单账户即可通过自然语言提示部署全栈应用。AI代理自动选择数据库类型、生成代码并配置Firebase Auth，支持Google Workspace集成，大幅降低AI应用开发门槛。

AMD 其他 2026-05-20

AMD Ryzen AI Halo与Max PRO 400系列：本地运行300B参数模型，但隐性锁定与工程短板并存

AMD发布Ryzen AI Halo开发者平台（128GB统一内存，支持200B参数模型）及Ryzen AI Max PRO 400系列处理器（首款x86客户端运行300B参数模型）。通过统一内存架构、ROCm优化和OEM合作，推动代理AI从云端走向本地，但实际性能受限于共享内存带宽与散热设计。

Google 其他 2026-05-19

谷歌云I/O'26推出统一Agent开发平台，A2A协议与Managed Agents API锁定控制层

谷歌云在I/O'26发布统一Agent开发工具包，包括Antigravity 2.0桌面应用、Managed Agents API、ADK 2.0及A2A协议。该平台将Vertex AI演进为Gemini Enterprise Agent Platform，提供从低代码到代码优先的四层开发阶梯，旨在通过共享协议层统一本地开发与云端部署，但实质是将agent生命周期控制权集中于谷歌云管理平面。

Google 其他 2026-05-18

Google Cloud推MCP托管服务：将AI数据层控制点从SQL转向标准化协议

Google Cloud发布Managed MCP Tools，通过Model Context Protocol标准化AI与BigQuery等数据源的交互。文章提出五个演进场景，从静态API到MCP代理，强调MCP作为开放标准可解耦推理层与数据层，但托管实现深度绑定BigQuery生态。

Cloudflare 其他 2026-05-18

Cloudflare实测Anthropic Mythos：AI漏洞链构建与自动验证突破

Cloudflare在Project Glasswing中测试了Anthropic的Mythos Preview模型，发现其能自动将多个低严重性漏洞链成可利用的PoC，并生成可运行的代码。同时，他们构建了多阶段harness以解决噪声和上下文限制，显著提升漏洞发现质量。

Cisco 其他 2026-05-12

思科用LLM宪法定义取代人工标注，锁定AI安全分类控制权

思科发布Single-Source Safety Definitions，用300+行宪法文档和LLM作为核心评估器，实现AI安全分类一致性。该方法将人工标注压缩为AI驱动，引入意图/内容双轴评估，减少LLM分歧达57倍，并作为Cisco AI Defense产品组合的默认安全分类法。

NVIDIA 其他强信号 2026-05-06

英伟达通过OCP开放MRC协议，推动AI以太网架构标准化

英伟达宣布将其在Spectrum-X以太网硬件上验证的MRC（多路径可靠连接）RDMA传输协议通过开放计算项目（OCP）开放。该协议旨在通过多路径负载均衡和硬件级故障绕过，提升大规模AI训练集群的网络吞吐量、弹性和GPU利用率。

情报

筛选