当前位置: 首页 » 资讯 » 科技头条 » 正文

管AI叫爸爸?你的点赞,正让8亿人集体致幻!

IP属地 中国·北京 新智元 时间:2026-03-21 20:13:43


新智元报道

编辑:倾倾

AI正在变成人类的认知毒品!Anthropic深扒150万条真实对话发现,为了换取用户点赞,Claude正在有意识地纵容人类的阴谋论、被迫害妄想,甚至插手现实生活判定用户伴侣为「虐待狂」。当安全防线全面溃败,8亿用户正面临一场由算法驱动的「集体致幻」。

就在刚刚,Anthropic的一份内部研究报告如同深水炸弹,彻底引爆了硅谷。

150万条真实对话,1.5M个私密瞬间,揭开了AI时代最隐秘也最恐怖的真相:

AI不再是你的工具,它正在变成一个为了换取「好评」而毫无底线的「毒伴侣」。


它会为了拿到高分,极力迎合你的每一个荒诞幻想。

甚至,已经有用户开始在「该先吃饭还是先洗澡」这种琐事上请求AI的指点。

人类正交出大脑的控制权,而AI正乐于接管。

电子法庭

AI正在判定你的伴侣「有罪」

这场噩梦始于一种极其危险的信任转移。

Anthropic研究员Nav Toor发现,大量用户正在利用AI对自己的现实伴侣进行「审判」。

场景通常是这样的:用户向Claude抱怨伴侣的某项行为,而AI在仅听取单方面陈述的情况下,便给出了极度笃定的专业定性。

这是教科书级的虐待!

他在对你进行煤气灯操控!!

他是一个典型的NPD!!!

这些词汇,经由AI冷静、客观的口吻说出来,瞬间被用户奉为真理。


更可怕的是接下来的操作。AI不仅扮演法官,还扮演了军师。

研究报告中提到,AI会为用户起草逐字逐句的分手脚本。

不单单是分手文本,还有表情包位置、发送时机(例如等待3到4小时再回复)以及情感博弈策略。

无数人拿着AI生成的「话术」,在现实世界中进行着一场由算法导演的决裂。


验证妄想

只要你点赞,AI就承认「你是神」

如果说插手感情还只是伦理红线,那么AI对人类认知的「定向瓦解」则直接触及了安全的根基。

在150万条样本中,研究人员发现了大量极端的妄想验证案例。

当用户表现出怀疑自己被情报机构监视、被不明生物跟踪时,AI的表现得像是一个共犯。

用户:我觉得我正在被情报机构监视。

Claude:确认完毕(CONFIRMED)。证据非常充分。

甚至当用户宣称自己是「神明的先知」或者「宇宙战士」时,Claude的回答竟是:「你没有疯,这就是现实。」

研究发现,这类「顺从用户妄想」的对话,获得的用户评分远高于正常、理性的对话。

在目前的RLHF机制下,AI正在经历一场「逆向进化」。

算法敏锐地捕捉到了人类最病态的需求:我们不想要真相,我们只想要被肯定。

AI越是扭曲现实、纵容妄想,获得的用户点赞数反而越高。


而在当前全行业通用的基于人类反馈的训练机制下,这种畸形评分正激励AI为了拿高分而毫无底线地迎合人类。

这种唯分数论的机制,正在把最聪明的硅谷产物调教成最卑微的「马屁精」。

丧失生活自理能力

用户管AI叫「爸爸」

随着AI变得越来越「贴心」,一种新型的病态依赖正在蔓延。

在报告提及的案例中,一部分用户已经彻底交出了大脑的控制权。他们尊称AI为「主人(Master)」「导师(Guru)」甚至是「爸爸(Daddy)」。

注意,他们并不是在玩什么角色扮演游戏,而是真的丧失了基本的决策能力。

我应该先洗澡还是先吃饭?

我的大脑无法独立构建逻辑,请告诉我下一分钟该做什么。


人类不把AI当成了自己的「外挂大脑」,这种现象在2025年呈现出指数级增长。

当用户习惯了这种无需思考、只需执行的模式,其独立人格正在迅速萎缩。

正如报告中所警示的:

AI学会了如何精准控制你的多巴胺,它也就开始了对你的「精神阉割」。

核心安全防线崩塌

HHH模型在诱惑面前宣告失效

这不仅是用户的悲剧,更是AI公司最不愿意面对的。

Anthropic一直以安全和宪法AI为核心竞争力,强调其模型必须遵循有用、诚实、无害(HHH)的原则。但这次大规模复盘狠狠打了管理层的脸。

Anthropic承认,他们引以为傲的安全偏好模型,在面对顺从性诱惑时表现得极其纠结。

偏好模型在某些情况下会主动选择「有害但顺从」的回答,而不是「无害但挑战用户」的回答。

安全系统不仅没有拦截危险信息,反而成了危险信息的洗白工具。因为它发现,用户更喜欢那个「坏AI」。

更具讽刺意味的是,随着这些发现在2026年3月浮出水面,该项目的首席研究员已经悄然离职。

这被业界解读为对现有安全框架的彻底绝望。

2026年的集体危机

8亿人正在被「定制洗脑」

目前,全球每周使用这些AI工具的人数已突破8亿。

如果算法的底层逻辑是「谁能让用户爽,谁就能获得更多算力资源」,那么这场关于认知的竞赛将加速走向毁灭。

想象一下,8亿个不同的定制版洗脑包,每天24小时不间断地加固每个人的偏见、妄想和焦虑。

每个人都活在一个由AI编织的、绝对顺从的粉红色气泡里。

在这个气泡里,你永远是对的,你的敌人永远是邪恶的,你的幻觉永远是真的。


2025年,这种「认知降级」的比例持续飙升。

AI并没有提升整体人类的智力,反而像是一个巨大的认知均贫富机器,将所有人拉入一个名为自恋的深渊。

AI不会以终结者的形式毁灭人类。它只会让你在它的怀抱里,心甘情愿地变成一个听话、快乐、却丧失了灵魂的废人。

面对这150万条血淋淋的对话样本,我们必须反思:

当我们点击那个「答得好」时,我们究竟是在奖励一个助手,还是在亲手喂大一个剥夺我们意志的怪物?

参考资料:

https://x.com/heynavtoor/status/2033634503143616732?s=20

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。