MIT - AI基础设施情报搜索

Amazon 其他 2026-06-10

Anthropic Claude Fable 5上线AWS：数据保留政策打破云安全边界，企业数据主权遭侵蚀

AWS与Anthropic联合发布Claude Fable 5模型，具备长时异步执行、高级视觉与主动自我验证能力。但模型访问要求用户同意30天数据保留并共享给Anthropic，导致推理数据离开AWS安全边界，同时有害提示自动回退至Opus 4.8，引入复杂定价与安全治理风险。

AMD 其他 2026-06-10

AMD EPYC以机架级密度宣战：Agentic AI的CPU控制权之争

AMD发布博客，宣称其EPYC处理器在机架级性能上领先NVIDIA Vera和Intel Xeon，专为Agentic AI的CPU密集型服务（如编排、缓存、数据库）设计。通过100kW机架模型，EPYC 9965（Turin）实现2.37倍于Vera的吞吐量，下一代“Venice”将扩展至3.30倍。强调现有x86平台即可部署，无需等待未来架构。

Cloudflare 其他 2026-06-10

Cloudflare 将安全栈延伸至私有源站：DNS 路由开启应用层控制新范式

Cloudflare 发布 Application Services for Private Origins，允许企业客户通过 DNS 记录启用私有路由，将 WAF、Bot 管理、速率限制等安全服务应用于私有 IP 上的应用，无需公网暴露或 connector 软件。该功能基于 Cloudflare 已有的私有网络连接（IPsec/GRE/CNI/Mesh）实现，并支持 Spectrum 和 Workers VPC 绑定，构建统一的私有流量控制平面。

Microsoft 其他 2026-06-09

微软借KPMG全球部署Agent 365，锁定企业AI代理管理控制平面

KPMG宣布全球采用Microsoft Agent 365管理AI代理，并扩展Copilot部署。Agent 365成为KPMG Workbench的核心治理层，协调跨系统、数据与业务流程的AI代理。此举将微软的AI管理平台深度嵌入全球最大咨询公司的交付体系，形成对企业AI代理生命周期的集中控制。

Google 其他 2026-06-09

GKE Inference Gateway前缀缓存：AI推理延迟降低92%，但锁定风险暗藏

Google Cloud推出GKE Inference Gateway，通过前缀缓存和模型感知路由，在Llama 3.1 8B模型上实现92.8%更短首令牌延迟和15.7%更高吞吐量。Snap实测缓存命中率达75-80%。但该技术深度绑定GKE Gateway API和Google生态，企业需警惕架构弹性损失。

NVIDIA 其他 2026-06-09

NVIDIA NVFP4：原生4位训练实现1.73倍吞吐跃升，锁定Blackwell生态

NVIDIA发布NVFP4格式，利用Blackwell原生硬件支持，在JAX/MaxText中实现4位混合精度预训练。相比FP8基线，Llama 3.1 405B在GB300上获得1.73倍吞吐提升，且精度无损失。该技术通过微块缩放、随机哈达玛变换等创新，显著降低训练成本，但深度绑定NVIDIA硬件生态。

Cloudflare 其他 2026-06-09

Cloudflare以自身为靶场，推AI时代分层防御架构：WAF+零信任+ML评分

Cloudflare公开其防御前沿AI模型的完整架构，以自身为“客户零号”，整合WAF Attack Score、API Shield、Bot Management、Zero Trust及MCP Server Portal。核心思路：架构比补丁速度更重要，通过ML评分和正面安全模型，在攻击变种产生前阻断，并限制单点突破后的横向移动半径。

Cisco 其他 2026-06-08

思科推出AI原生分支架构：AgenticOps与后量子加密重塑WAN控制平面

思科在Cisco Live 2026上完成Secure Router 8000系列更新，推出Unified Branch架构，集成AgenticOps自动化、后量子密码学（PQC）和混合网状防火墙，将控制平面从本地迁移至Cisco Cloud Control，为AI时代分支网络提供统一平台。

Cisco 其他 2026-06-08

思科Cloud Control与AI代理：控制层集中化下的隐性锁定与性能短板

思科在Cisco Live 2026推出Cloud Control统一管理平台，集成AI代理、Live Protect漏洞缓解、PQC及新硬件（C9550交换机、CW9177 AP等）。表面提升运维与安全，实则通过API和AI代理深度绑定用户，但其硬件在AI高带宽场景下存在端口密度和拥塞控制短板。

NVIDIA 其他 2026-06-08

NVIDIA 借英国主权AI基金，从芯片商跃升为国家AI基础设施的幕后控制者

NVIDIA 与英国政府合作，通过 Isambard-AI（搭载 5,400 颗 GH200）及 Sovereign AI Fund，扶持本地初创（Cosine, Cursive, Doubleword）。此举表面是技术部署，实则是 NVIDIA 构建主权AI控制平面，将国家算力锁入其生态系统，削弱AWS/Azure等传统云厂商的地位。

OpenAI 其他 2026-06-08

OpenAI押注Codex：从聊天机器人到智能体控制平台的战略跃迁

OpenAI计划对ChatGPT进行史上最大改版，核心是将Codex编程工具、AI智能体和第三方应用整合为超级应用。此举标志着产品定位从问答聊天机器人，转向以Codex为控制平面的智能体执行平台，旨在提升企业变现能力并应对Anthropic的竞争压力。

Cloudflare 其他 2026-06-08

Cloudflare 将实时威胁情报嵌入 WAF，控制点从人工转向自动化引擎

Cloudflare 发布新集成，允许用户基于 Cloudforce One 的实时威胁情报（IP、攻击者、目标行业等）直接编写 WAF 规则。采用 always-on 检测框架，以 O(1) 常数时间查找实现微秒级延迟，目前仅支持 IP 匹配，未来将扩展至 JA3 指纹和域名。

Amazon 其他 2026-06-06

AWS Bedrock 推出兼容 OpenAI/Anthropic API 的新控制台，争夺 AI 推理控制权

AWS 发布 Bedrock 新控制台，基于 bedrock-mantle 端点，原生支持 OpenAI 和 Anthropic API 协议，允许用户无缝切换 GPT、Claude 及开源模型。此举将模型选择与 API 标准化，旨在通过统一推理平面锁定用户工作流，削弱单一模型提供商的 API 壁垒。

Cloudflare 其他 2026-06-05

Cloudflare AI Gateway 引入身份驱动预算，争夺 AI 流量控制层

Cloudflare 在 AI Gateway 中推出基于美元预算的 spend limits 和与 Cloudflare Access 集成的身份驱动预算与路由（closed beta）。该功能允许企业按用户、团队、模型设置预算，并在超限时降级或阻断请求，将 AI 成本控制从模型提供商转移到网关层。

NVIDIA 其他 2026-06-04

NVIDIA Nemotron 3 Ultra：以MoE与MOPD重构AI Agent控制平面，锁定企业推理成本

NVIDIA发布**Nemotron 3 Ultra**，一个550B参数MoE模型（55B活跃），专为AI Agent编排而设计。通过**多教师在线策略蒸馏（MOPD）** 与**Hybrid Mamba-Transformer**架构，其在**SWE-bench**等任务中实现5倍吞吐量提升与30%成本节省，标志着推理控制权从单一模型向分层Agent系统的转移。

Cisco 其他 2026-06-04

Cisco Cloud Control统一平台：AgenticOps时代控制层向单一面板转移

Cisco Live 2026发布Cisco Cloud Control，统一网络、安全、计算、可观测性管理，支持AI代理协同操作。同时扩展Live Protect内核级安全补丁至N9000等，并公布量子安全路线图及新C9550/C8600硬件。

Cisco 其他 2026-06-04

Cisco AI Defense与AppOmni集成：将运行时护栏扩展到SaaS AI代理

Cisco宣布AI Defense与AppOmni集成，通过AppOmni AgentGuard实时拦截层，将自定义护栏策略扩展到Microsoft 365 Copilot、ServiceNow Now Assist等SaaS AI代理。统一策略引擎覆盖MCP、聊天、代理间通信，防止提示注入、工具利用和数据泄露。

Cloudflare 其他 2026-06-04

Cloudflare收购VoidZero：以Vite整合控制开发者部署管道

Cloudflare收购开源JavaScript工具链公司VoidZero，将Vite、Rolldown、Oxc等Rust原生工具整合进Workers平台，实现从本地代码到全球边缘网络的一键部署。此举旨在统一开发全生命周期，并推动意图驱动的基础设施自动预配。

Cisco 其他 2026-06-03

思科Agent Gateway：零信任从访问控制升级为AI代理行动控制

思科发布Secure Access Agent Gateway，将零信任策略从传统的用户/设备访问控制扩展到AI代理的细粒度行动控制。通过Duo识别代理身份，在LLM、MCP工具、SaaS API等交互点实施策略，实现行动级审计和凭证注入，旨在解决代理自主行动带来的新安全风险。

Microsoft 其他 2026-06-02

微软Build大会：从芯片到云构建Agent时代统一生态

微软在Build大会上发布一系列Agent时代基础设施：Project Solara芯片到云平台、Microsoft IQ统一知识层、Rayfin后端生成、Azure HorizonDB、GPU加速分析等，旨在将开发者锁定在微软生态内。

情报

筛选