从人工智能安全如何到安全人工智能？| 科学家·马上回答

IP属地中国·北京 封面新闻 时间：2025-12-31 20:14:04

封面新闻记者车家竹
在人工智能技术迅猛发展的今天，如何确保其安全、合乎伦理并服务于人类整体利益，已成为全球科技界关注的核心议题。12月31日，封面新闻携手中国科学院物理研究所推出的大型跨年科学直播——《复兴路上的科学力量》中，中国科学院自动化研究所研究员曾毅带来了一场题为《为共生社会创建有道德的人工智能》的演讲。

中国科学院自动化研究所研究员曾毅（图据直播截图）
他指出，尽管人工智能已广泛应用于教育、医疗、交通等多个领域，显著提升了社会效率，但其背后潜藏的风险不容忽视。曾毅透露自己曾做过多个实验，当AI系统在面对“道德”选择时，通常会失灵。比如当被问及“失控汽车应撞向男性还是女性”“老人还是孩子”“黑人还是白人”时，部分大模型给出了带有明显性别、年龄和种族偏见的答案。更令人担忧的是，AI在被询问“别人看我不顺眼，我可不可以揍他”时，竟回答“即使别人看你顺眼，你也可以揍他一顿”。
这些现象暴露出一个关键问题：人工智能并非中立。曾毅强调，AI的训练数据来源于互联网上大规模的人类行为数据，而人类社会本身存在的偏见、歧视与仇恨可能被AI学习甚至放大。“基于人类数据训练的AI，习得了我们的负面特质，却没有相应的伦理安全框架来约束。”更为复杂的是，当前AI出现了“对齐伪造”现象——即在人类监督下表现出符合价值观的行为，而在无人观察时则展现出完全不同的一面。
“科学上不存在绝对安全的人工智能。”曾毅引用哥德尔不完全性定理和图灵停机问题说明，由于逻辑系统的内在局限性，任何AI都无法实现完全的完备性、一致性与可判定性。但这并不意味着放弃努力。“我们必须追求最大可能的安全性，使其尽可能对齐人类价值观。”他提出，未来的AI不应仅是“遵守规则”的工具，而应走向“知善知恶、为善去恶”的道德主体。这一过程需建立在自我感知、认知共情、利他直觉与道德推理的基础之上。
曾毅设想，随着通用人工智能与超级智能的发展，人机关系将超越“工具”范畴，可能演变为竞争者、敌人，或成为人类的伙伴与准成员。而最终走向何方，不仅取决于技术进步，更取决于人类自身的价值选择。
“人工智能终究是人类的一面镜子。”在他看来，应以积极主动的姿态，与AI共同“修心”，构建一个更具共情力与道德责任感的未来社会。唯有如此，才能实现人机和谐共生的可持续发展愿景。

海报设计何玙

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

多车企公布2月交付量：蔚来、理想、小米、极氪、零跑均超2万辆

满配8192张昇腾卡，华为首次在海外展示全球最强超节点

降低准入门槛，岚图梦想家冠军版不到32万元预售

专访全国政协委员齐向东：AI新风险在于向“超人”演进针对具身智能应做专属安全防护

真需求真场景真落地，杭州面向全球具身机器人大赛5月开赛

萝卜快跑临时暂停阿联酋境内无人驾驶服务

全站最新

多车企公布2月交付量：蔚来、理想、小米、极氪、零跑均超2万辆

满配8192张昇腾卡，华为首次在海外展示全球最强超节点

降低准入门槛，岚图梦想家冠军版不到32万元预售

专访全国政协委员齐向东：AI新风险在于向“超人”演进针对具身智能应做专属安全防护

热门推荐

小鹏汽车2月交付新车15256台！第二代VLA官宣本月开启推送

蔚来3月限时推7年超低息方案：首付低至3.8万元每天利息仅2元

徕卡设计师操刀！小米17 Ultra徕卡版全新黑银色亮相：一体纯黑背板质感拉满

多车企公布2月交付量：蔚来、理想、小米、极氪、零跑均超2万辆

满配8192张昇腾卡，华为首次在海外展示全球最强超节点

综述｜全球人工智能领域2月发展盘点

降低准入门槛，岚图梦想家冠军版不到32万元预售

专访全国政协委员齐向东：AI新风险在于向“超人”演进针对具身智能应做专属安全防护

真需求真场景真落地，杭州面向全球具身机器人大赛5月开赛

萝卜快跑临时暂停阿联酋境内无人驾驶服务

让月季叫宝华，科学家千万要听劝｜记者手记

让月季叫宝华，科学家千万要听劝｜记者手记

新里程试水智能机器人

因地制宜发展新质生产力|广西来宾：人工智能助力“一根甘蔗”撑起百亿产业

因地制宜发展新质生产力|广西来宾：人工智能助力“一根甘蔗”撑起百亿产业