思科发布LLM安全排行榜，推动模型安全标准化评估

内容摘要

思科推出大语言模型安全排行榜，基于单轮和多轮攻击测试提供客观安全排名。该工具采用标准化评估框架，映射攻击数据至思科AI安全分类法，公开排名和方法论。旨在为企业AI部署前提供安全风险评估，填补模型安全基准测试空白。

核心要点

思科发布LLM安全排行榜，对基础模型进行单轮和多轮攻击场景测试，无额外安全护栏以确保公平基线评估。安全综合评分中单轮抵抗和多轮防御各占50%权重。

攻击数据映射至思科AI安全框架分类法，便于识别模型对特定攻击类型的易感性。平台包含排名、框架和方法论三大板块，展示详细性能指标。

初始排名显示不同模型安全能力差异显著，部分模型抵抗率超85%，另一些在多轮操纵策略存在明显弱点。

重要性说明

思科通过标准化安全评估确立AI安全话语权，推动行业安全基准统一。这将影响企业AI模型选型标准，强化安全在AI部署中的决策权重。...

登录查看完整战略分析

免费注册

来源： Cisco Blog

查看原文 →