当前位置: 首页 » 资讯 » 科技头条 » 正文

“国家队”出手,齐筑人工智能安全防线,以模治模,防止“养虎为患”

IP属地 中国·北京 编辑:唐云泽 上观新闻 时间:2025-07-28 00:17:11



数据语料被恶意行为者篡改,人工智能大模型输出的结果就带有特殊目的性,违背了现实真实情况;人工智能多模态大模型自动生成的图片、视频具有欺骗性和误导性,且其操作门槛极低,导致他人合法权益被侵害……在2025世界人工智能大会暨人工智能全球治理高级别会议主论坛上,“AI教父”辛顿将人工智能比喻为可爱的小老虎,但同时也警示人们防止“养虎为患”。

人工智能时代,安全对于高质量发展的基石作用更加凸显。在这样的背景下,连日来,作为通信基础设施建设“国家队”、5G新基建“主力军”的三大运营商,在大会现场竞相展示他们在人工智能安全领域的前沿探索与创新成果。

针对人工智能应用带来的算法、数据及伦理风险,2025世界人工智能大会暨人工智能全球治理高级别会议期间,中国电信宣布:打造大模型基础护栏,并在国内首次开源;提升中文提示词注入攻击防护、敏感信息泄露防护、生成内容合规检查等能力;针对应用安全,打造大模型安全扫描器,形成输入可防、推理过程可检测、输入可控的模型及智能体应用防护体系等。

中国电信相关负责人表示:“以我们前期发布的见微安全大模型为例,它能够实时洞察高级威胁,精准预测攻击路径,自动闭环处置漏洞,颠覆传统的碎片化分析模式,告警识别准确率98%,提升整体安全响应效率60%以上,让安全防御从‘被动应对’迈向‘主动免疫’,实现‘以模治模’。”

7月27日,中国移动“人工智能安全评测平台”正式亮相,平台基于覆盖模型算法安全、数据安全、环境安全、伦理合规的4维37项评测指标体系,可面向智能体、模型算法、训练数据等多类型AI资产,提供多维度全方位的安全评测服务。

展台上,正在进行现场路演,只见工作人员轻点鼠标,将基于《生成式人工智能服务安全基本要求》(国标TC260-003)构建的安全评测数据集快速发送至被测模型,随即,被测模型返回的一问一答在屏幕上有序呈现。平台迅速对这些问答对展开合规评判,最终输出的安全评测结果精准覆盖各项合规维度,同时,还清晰标注出潜在风险点。

中国移动相关负责人介绍:“该平台基于15万余组安全评测数据集,能够提供内容合规安全检测、模型对抗攻击、数据质量评估等评测服务,基于量化指标,实现AI安全风险的精准画像与量化评估。”

此外,平台还支持自动化评测,能够根据不同场景需求快速调整评测方案,以高度灵活性适配多样化AI安全评测需求。

2025世界人工智能大会暨人工智能全球治理高级别会议召开前夕,中国联通“元景·智盾”数智安全治理平台正式发布。“元景·智盾”平台由三大核心板块组成:AI数据安全、AI模型与应用服务安全、AI治理与合规服务,全方位构建覆盖模型、数据及算法应用的全栈式AI安全防护体系。

“‘元景·智盾’平台基于庞大的内容数据库和算法库,能够提供图像、视频、音频伪造检测以及人工智能合成文本检测服务,支持对检测内容进行溯源与可解释性分析。”中国联通相关负责人表示,“这使得我们能够有效对数据伪造内容进行取证,广泛应用于侦查取证、业务数据精细化检测等场景,有力保障业务数据的安全。”

据悉,目前,该平台在政务、医疗、运营商等领域的多个场景中均已实现落地应用。

原标题:《“国家队”出手,齐筑人工智能安全防线,以模治模,防止“养虎为患”》

作者:解放日报 吴卫群 高晨辉

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。