Anthropic发布Claude Opus 4.7并引入网络安全护栏

内容摘要

Anthropic正式发布Claude Opus 4.7模型，在复杂软件工程、多模态理解和长时推理任务上实现显著提升。该版本首次引入了针对高风险网络安全用途的自动检测与拦截护栏，并为安全研究设立了验证程序，旨在为更强大模型（如Mythos）的广泛发布积累安全经验。

核心要点

Claude Opus 4.7相比Opus 4.6在高级编码、视觉分辨率（支持~3.75MP图像）和长时任务一致性上均有提升。

Anthropic明确表示，在训练中尝试了“差异化降低”其网络能力，并部署了自动防护措施，以阻止被禁止或高风险的网络安全用途请求。此举是Project Glasswing倡议的一部分，旨在从现实部署中学习，为未来Mythos级模型的广泛发布铺路。

同时，Anthropic设立了“网络安全验证计划”，邀请安全专业人员为合法研究目的（如漏洞研究、渗透测试）申请使用权限。

重要性说明

核心转移：AI模型安全治理责任正从纯事后过滤，向训练阶段主动“能力塑造”和部署时“护栏设计”前移。Anthropic通过分级发布和验证程序，试图在能力开放与风险控制间建立新范式。...

登录查看完整战略分析

免费注册

PRO 决策建议

🔒

决策建议仅对 Pro 用户开放

升级至 Pro $29/月

来源： Anthropic News

查看原文 →