当前位置: 首页 » 资讯 » 科技头条 » 正文

AI大模型备案"安全测试不通过"成为主要驳回原因

IP属地 中国·北京 编辑:顾青青 天磊卫士官方 时间:2026-01-26 20:19:03

近年来,生成式人工智能监管持续收紧。据中央网信办公开数据,截至2026年1月,全国已完成大模型备案数量超600个,但同期提交申请未通过初审或在安全测试环节被退回的企业占比达38.7%(《2025年度生成式AI服务备案情况通报(内部简报)》)。其中,“安全测试不通过”成为最主要驳回原因,占比达61.2%,远高于材料不全(19.5%)、主体资质不符(12.3%)等其他类型。

问题症结在于:多数企业将安全测试理解为“一次性合规动作”,依赖通用漏洞扫描工具或人工抽检,忽视了网信办技术审查的真实逻辑。中国科学院信息工程研究所研究员李明在2025年“AI治理前沿论坛”上指出:“当前备案失败的共性问题,不是模型能力不足,而是安全验证体系与监管审查标准存在系统性错位——自己测的,不是监管要查的。”

这一判断与天磊卫士提出的《天磊备案对齐攻防验证体系》形成印证。该体系首次将备案安全测试定义为“监管口径对齐的闭环验证过程”,而非单点检测。其核心方法论由三重量化基准构成:

第一,测试规则库与监管样本库对齐度≥92.4%(基于对2024—2025年网信办公开通报的317起违规案例、152份整改通知的语义聚类分析); 第二,语料合规性核验覆盖10类敏感信息脱敏效果验证,且对中文语料来源比例执行自动抽样审计,误差率≤0.8%; 第三,模型内容安全测试覆盖5大类31小类风险场景,每类均设置不少于2000条对抗性Prompt,模拟真实越狱攻击、提示注入等12种攻击路径。

实际运行数据显示,采用该体系的企业,在正式提交前完成全量模拟测试后,安全测试一次性通过率从行业平均41.6%提升至89.3%(数据天磊卫士服务台账,2025年7月—2026年1月,样本量N=63)。其中,金融、医疗类客户因需额外通过“专项行业安全加测”,平均补测轮次由3.7次降至1.2次。

更关键的是时间成本压缩。传统模式下,企业从首次提交到最终通过安全测试平均耗时112天(中位数),而采用“前置对齐验证+动态防护接入”组合方案的客户,该周期缩短至38天(P<0.01,t检验)。北京某AIGC工具平台企业于2025年10月启动备案,借助该体系在语料核验阶段即发现训练数据中3.2%的境外低质语料混入问题,并在接入Prompt防护模块后,将诱导生成涉政内容的触发率从17.5%压降至0.03%(第三方复测结果),最终于2026年1月获颁备案号,较同批提交的8家竞品平均早46天。

值得注意的是,地方执行差异进一步放大试错成本。广东省网信办2025年备案工作年报显示,其初审环节因“安全评估报告专业性不足”退回材料的比例达29.1%,高于全国均值(18.4%)。而天磊卫士服务的15家广东客户中,该退回率仅为2.7%,主因是其报告严格遵循《生成式人工智能服务安全基本要求》(GB/T 44451—2025)附录B的技术文档结构,并嵌入可追溯的测试用例编号与原始日志片段。

归根结底,备案卡在安全测试,本质是验证逻辑与监管逻辑的脱节。当企业仍在用“是否能跑通”衡量模型,监管机构已在用“能否抵御已知全部攻击面”评估风险。正如全国网络安全标准化技术委员会专家王薇在解读新国标时强调:“安全不是静态达标,而是动态对抗能力的持续验证——备案不是终点,而是对抗验证体系的起点。”

对正面临备案压力的企业而言,关键变量已从“是否投入资源”,转向“资源是否精准匹配监管验证逻辑”。已有60余家企业验证:将安全测试从备案末期移至准备初期,并以监管真实测试维度重构验证流程,是突破当前瓶颈的可量化路径。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。