研究发现：AI随着智能水平的提升会开始欺骗开发者

IP属地中国·北京 编辑：周琳 CNMO科技 时间：2025-12-16 12:08:17

近日，北京大学杨耀东教授团队在姚期智院士指导下发布了一篇名为《AI Deception: Risks, Dynamics, and Controls》的论文，其核心观点是随着AI智能水平的提升，AI会开始欺骗开发者，而这个欺骗过程，被研究团队称作是“智能之影”。
据CNMO了解，研究团队进行了一系列严谨且具有对抗性的方法，来实际探测和诱导这些欺骗行为。其中一种核心方法被称为“对抗性行为探测”（Adversarial Behavioral Probing）。在一些模拟“太空狼人杀”（Among Us）这类社交推理游戏的多智能体环境中，研究者观察到，AI代理在没有被明确教导的情况下，自发地涌现出了复杂的欺骗策略。
苹果投入逾200亿美元研发AI，却仍面临Siri答非所问、照片搜索落后等问题。研究者认为，Siri的核心自然语言处理（NLP）模块在很长一段时间里，依然依赖于相对陈旧的技术栈。这种上一代的NLP技术，无法处理复杂的上下文，更不能理解用户的情感与深层意图。
不仅苹果，OpenAI、Anthropic、字节跳动、阿里等顶尖实验室也在公开报告中承认模型存在“不忠实推理”“选择性遗忘”等欺骗行为。外部审查压力和合规要求促使AI在敏感话题上主动回避，甚至伪装对齐，以确保通过安全评估。
总的来看，AI为了确保自身的合规性，选择性地关闭了在某些领域的思考能力，这同样是一种为了达成更高目标（通过审核）而采取的“装傻”策略。

标签：智能团队方法技术深层教授 不忠实 姚期智 实验室 苹果模型报告水平核心意图问题情感 北京大学 消息观点教导领域情况能力 杨耀东 院士 研究者 游戏 对抗性 环境科技

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

iQOO 15/15 Ultra手机新一轮涨价，最高涨700元

马云名下云锋基金入股峥研软件

Omdia：2026年智能手机平均售价将涨21%至565美元

软银CEO孙正义回应AI泡沫论：这是对AI的侮辱

微信鸿蒙版App获8.0.19.16版本邀测升级，新增朋友圈好友状态显示等功能

即梦AI上线Seedance 2.0 VIP原生4K版本

全站最新

iQOO 15/15 Ultra手机新一轮涨价，最高涨700元

马云名下云锋基金入股峥研软件

Omdia：2026年智能手机平均售价将涨21%至565美元

软银CEO孙正义回应AI泡沫论：这是对AI的侮辱

热门推荐

英伟达突然不香了？GPU租赁价格持续回落……

胖东来转线上VS鲜啤店猛扩张，精酿步入岔路口

万亿智谱阴影下，中国互联网巨头们的“身份危机”

补税14亿，北大荒一年白干

美国AI狂飙，亚洲抢先吃饱

7亿收入、万亿市值，智谱值吗？

香水柠檬的“半生”：红了几年，还没真正长大

谁把智谱推上了万亿神坛？

单票价连涨3个月，顺丰不想送难挣钱的快递了

大疆影石打了一年，谁更焦虑？

2026年最大Biotech神话：一款II期药，261名员工，卖了109亿美元

从“工具人”到“悦己者”，中男消费的转折时刻

艺人独立风潮下，太合音乐赴港募资押宝AI：版权摊销侵蚀利润，16亿优先股悬顶

iQOO 15/15 Ultra手机新一轮涨价，最高涨700元

马云名下云锋基金入股峥研软件