Architecture Shift
影响: Important
强度: High
置信: 85%
思科将AI安全分类体系全面转向AI驱动的“宪法”定义模型
内容摘要
思科宣布其AI安全产品组合将全面采用基于详细自然语言“宪法”定义的单源真相模型,利用LLM替代人工标注者进行一致性分类与评估,并计划将此模型扩展至AI供应链安全等领域。
核心要点
思科研究团队提出“单源安全定义”,将每个安全威胁技术(如骚扰、仇恨言论)的定义编写为300多行的详细自然语言文档(称为“宪法”)。该文档作为唯一真相源,由LLM在每次分类时完整读取并执行,用于运行时分类、生成合成数据、标注指南和客户解释。
研究显示,与传统的段落级定义相比,使用“宪法”可将不同前沿LLM之间的分类不一致性降低高达57倍。LLM作为评估者,在遵循详细规则方面超越了受限于工作记忆的人类标注者。思科将此视为构建AI安全系统的具体范式转变。
研究显示,与传统的段落级定义相比,使用“宪法”可将不同前沿LLM之间的分类不一致性降低高达57倍。LLM作为评估者,在遵循详细规则方面超越了受限于工作记忆的人类标注者。思科将此视为构建AI安全系统的具体范式转变。
重要性说明
这代表了AI安全运营模式的核心转移:从依赖模糊的人类经验判断,转向由AI执行、可审计、可解释的精确规则引擎。若成为行业标准,将重塑企业AI安全系统的构建、验证和合规方式。
PRO 决策建议
**厂商/Vendors**: 应评估将安全策略“代码化/宪法化”的能力,控制AI安全系统的“规则解释层”。不构建此能力,可能在未来失去对AI安全有效性定义的控制权。
**企业/Enterprises**: 需重新思考AI安全护栏的评估和验证模式,从测试“黑盒模型”转向审计“可执行规则”。应要求供应商提供基于明确“宪法”定义的可解释性。
**投资者/Investors**: 关注价值从通用AI安全模型向“AI驱动的策略管理与执行平台”迁移。监测其他主要安全厂商是否跟进类似“定义即代码”的架构。
**企业/Enterprises**: 需重新思考AI安全护栏的评估和验证模式,从测试“黑盒模型”转向审计“可执行规则”。应要求供应商提供基于明确“宪法”定义的可解释性。
**投资者/Investors**: 关注价值从通用AI安全模型向“AI驱动的策略管理与执行平台”迁移。监测其他主要安全厂商是否跟进类似“定义即代码”的架构。
💬 评论 (0)