Anthropic发布《Zero Trust for AI Agents》安全框架
Anthropic于2026年5月27日发布《Zero Trust for AI Agents》白皮书,系统定义了企业AI Agent部署的安全框架。白皮书提出三条核心原则:永远不信任始终验证、假设已被攻破、最小权限。识别五大Agent特有威胁:提示注入(间接注入通过外部数据源,Microsoft Research确认LLM无法可靠区分信息性上下文和可执行指令)、工具投毒(首个野外恶意MCP服务器已发现)、身份/权限滥用(困惑代理人问题+记忆缓存凭证跨会话提权)、记忆/上下文投毒、供应链攻击。定义六大安全能力域的三级路线图(Foundation/Enterprise/Advanced),其中密码学身份+短命Token被列为Foundation底线——静态API Key即使带轮换策略也视为已被攻破。提出'设计测试':摩擦型措施(速率限制/跳板/短信MFA)对AI攻击者无效,必须优先移除能力而非限流能力。Agentic SOAR为防御运营新范式,几秒内应对AI驱动攻击。