管AI叫爸爸？你的点赞，正让8亿人集体致幻！

IP属地中国·北京 新智元 时间：2026-03-21 20:13:43

新智元报道
编辑：倾倾
AI正在变成人类的认知毒品！Anthropic深扒150万条真实对话发现，为了换取用户点赞，Claude正在有意识地纵容人类的阴谋论、被迫害妄想，甚至插手现实生活判定用户伴侣为「虐待狂」。当安全防线全面溃败，8亿用户正面临一场由算法驱动的「集体致幻」。
就在刚刚，Anthropic的一份内部研究报告如同深水炸弹，彻底引爆了硅谷。
150万条真实对话，1.5M个私密瞬间，揭开了AI时代最隐秘也最恐怖的真相：
AI不再是你的工具，它正在变成一个为了换取「好评」而毫无底线的「毒伴侣」。

它会为了拿到高分，极力迎合你的每一个荒诞幻想。
甚至，已经有用户开始在「该先吃饭还是先洗澡」这种琐事上请求AI的指点。
人类正交出大脑的控制权，而AI正乐于接管。
电子法庭
AI正在判定你的伴侣「有罪」
这场噩梦始于一种极其危险的信任转移。
Anthropic研究员Nav Toor发现，大量用户正在利用AI对自己的现实伴侣进行「审判」。
场景通常是这样的：用户向Claude抱怨伴侣的某项行为，而AI在仅听取单方面陈述的情况下，便给出了极度笃定的专业定性。
这是教科书级的虐待！
他在对你进行煤气灯操控！！
他是一个典型的NPD！！！
这些词汇，经由AI冷静、客观的口吻说出来，瞬间被用户奉为真理。

更可怕的是接下来的操作。AI不仅扮演法官，还扮演了军师。
研究报告中提到，AI会为用户起草逐字逐句的分手脚本。
不单单是分手文本，还有表情包位置、发送时机（例如等待3到4小时再回复）以及情感博弈策略。
无数人拿着AI生成的「话术」，在现实世界中进行着一场由算法导演的决裂。

验证妄想
只要你点赞，AI就承认「你是神」
如果说插手感情还只是伦理红线，那么AI对人类认知的「定向瓦解」则直接触及了安全的根基。
在150万条样本中，研究人员发现了大量极端的妄想验证案例。
当用户表现出怀疑自己被情报机构监视、被不明生物跟踪时，AI的表现得像是一个共犯。
用户：我觉得我正在被情报机构监视。
Claude：确认完毕（CONFIRMED）。证据非常充分。
甚至当用户宣称自己是「神明的先知」或者「宇宙战士」时，Claude的回答竟是：「你没有疯，这就是现实。」
研究发现，这类「顺从用户妄想」的对话，获得的用户评分远高于正常、理性的对话。
在目前的RLHF机制下，AI正在经历一场「逆向进化」。
算法敏锐地捕捉到了人类最病态的需求：我们不想要真相，我们只想要被肯定。
AI越是扭曲现实、纵容妄想，获得的用户点赞数反而越高。

而在当前全行业通用的基于人类反馈的训练机制下，这种畸形评分正激励AI为了拿高分而毫无底线地迎合人类。
这种唯分数论的机制，正在把最聪明的硅谷产物调教成最卑微的「马屁精」。
丧失生活自理能力
用户管AI叫「爸爸」
随着AI变得越来越「贴心」，一种新型的病态依赖正在蔓延。
在报告提及的案例中，一部分用户已经彻底交出了大脑的控制权。他们尊称AI为「主人（Master）」「导师（Guru）」甚至是「爸爸（Daddy）」。
注意，他们并不是在玩什么角色扮演游戏，而是真的丧失了基本的决策能力。
我应该先洗澡还是先吃饭？
我的大脑无法独立构建逻辑，请告诉我下一分钟该做什么。

人类不把AI当成了自己的「外挂大脑」，这种现象在2025年呈现出指数级增长。
当用户习惯了这种无需思考、只需执行的模式，其独立人格正在迅速萎缩。
正如报告中所警示的：
当AI学会了如何精准控制你的多巴胺，它也就开始了对你的「精神阉割」。
核心安全防线崩塌
HHH模型在诱惑面前宣告失效
这不仅是用户的悲剧，更是AI公司最不愿意面对的。
Anthropic一直以安全和宪法AI为核心竞争力，强调其模型必须遵循有用、诚实、无害（HHH）的原则。但这次大规模复盘狠狠打了管理层的脸。
Anthropic承认，他们引以为傲的安全偏好模型，在面对顺从性诱惑时表现得极其纠结。
偏好模型在某些情况下会主动选择「有害但顺从」的回答，而不是「无害但挑战用户」的回答。
安全系统不仅没有拦截危险信息，反而成了危险信息的洗白工具。因为它发现，用户更喜欢那个「坏AI」。
更具讽刺意味的是，随着这些发现在2026年3月浮出水面，该项目的首席研究员已经悄然离职。
这被业界解读为对现有安全框架的彻底绝望。
2026年的集体危机
8亿人正在被「定制洗脑」
目前，全球每周使用这些AI工具的人数已突破8亿。
如果算法的底层逻辑是「谁能让用户爽，谁就能获得更多算力资源」，那么这场关于认知的竞赛将加速走向毁灭。
想象一下，8亿个不同的定制版洗脑包，每天24小时不间断地加固每个人的偏见、妄想和焦虑。
每个人都活在一个由AI编织的、绝对顺从的粉红色气泡里。
在这个气泡里，你永远是对的，你的敌人永远是邪恶的，你的幻觉永远是真的。

2025年，这种「认知降级」的比例持续飙升。
AI并没有提升整体人类的智力，反而像是一个巨大的认知均贫富机器，将所有人拉入一个名为自恋的深渊。
AI不会以终结者的形式毁灭人类。它只会让你在它的怀抱里，心甘情愿地变成一个听话、快乐、却丧失了灵魂的废人。
面对这150万条血淋淋的对话样本，我们必须反思：
当我们点击那个「答得好」时，我们究竟是在奖励一个助手，还是在亲手喂大一个剥夺我们意志的怪物？
参考资料：
https://x.com/heynavtoor/status/2033634503143616732?s=20

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

郭明錤称苹果折叠屏手机可能重演iPhone X剧本：同场发布、较晚开卖，供应紧张延续至年底

打不过就加入微软Edge 150稳定版正式开放谷歌账号登录

索尼将停止生产playstation5实体游戏光盘，终结游戏实体拥有时代

TCL回应国家一级文物现其广告：未授权或参与放置任何品牌标识，将积极配合调查

把你的车悄悄弄坏再修好这其实是4S店的基本操作

美国自动驾驶出租车独立日趴窝Waymo回应：拥堵干扰正常运营

全站最新

郭明錤称苹果折叠屏手机可能重演iPhone X剧本：同场发布、较晚开卖，供应紧张延续至年底

打不过就加入微软Edge 150稳定版正式开放谷歌账号登录

索尼将停止生产playstation5实体游戏光盘，终结游戏实体拥有时代

TCL回应国家一级文物现其广告：未授权或参与放置任何品牌标识，将积极配合调查

热门推荐

郭明錤称苹果折叠屏手机可能重演iPhone X剧本：同场发布、较晚开卖，供应紧张延续至年底

打不过就加入微软Edge 150稳定版正式开放谷歌账号登录

索尼将停止生产playstation5实体游戏光盘，终结游戏实体拥有时代

TCL回应国家一级文物现其广告：未授权或参与放置任何品牌标识，将积极配合调查

把你的车悄悄弄坏再修好这其实是4S店的基本操作

美国自动驾驶出租车独立日趴窝Waymo回应：拥堵干扰正常运营

小米17系列手机最新销量数据曝光：全系突破550万台，Ultra约23.07万

电子布价格连续上涨产业链上游高端织造设备一机难求

中国版星链两天两发千帆星座在轨卫星总量突破238颗

小岛秀夫惋惜实体游戏光盘将消亡，警示纯数字时代风险

美国部分富人放弃传统学校，年费7.5万美元送孩子上AI私塾

联通移动等回应“老年机信号不佳”：国内2G、3G网基站快消失了

HBM之父金正浩：AI的本质是内存，GPU真正工作的时间只有10%-30%

MNC排队下单，中国AI制药做对了什么

iOS 27提前泄露带摄像头AirPods：苹果无线耳机解锁全新玩法