Project Redline:大模型自动化红队攻击框架
状态:
实验室验证2026-05-30 11:41:18
发起人/团队:
AI 安全伦理委员会
核心:
"为了防止 AI 变坏,我们造了一个专门攻击 AI 的系统。"
技术栈:
自动 Prompt 生成 → 多轮对抗攻击 → 安全评估报告 → 合规认证支持
项目简介:
自动生成数万种越狱提示词和对抗样本,持续攻击目标模型。只有通过 Redline 压力测试的工业 AI 模型,才被允许上线商用。已用于内部 MES AI 排程官的安全评估。
验收指标: 覆盖 OWASP LLM Top 10 全部攻击类型,误报率 < 5%
关联方案: 所有工业 AI Agent 产品线