![]()
最近,这届被大模型忽悠瘸了的网友,正在网上疯狂开 “ 智障操作大赏 ”。
前段时间就闹出了个奇葩新闻,有人让 AI 去帮忙预约寿司郎。
AI 不仅满口答应,还煞有介事地生成了出了店铺精确位置、就餐时间、人数和报到码,它甚至贴心地告诉用户:“ 现在不需要做任何操作,只需保存此页面,向店员出示即可直接入座 ”。
![]()
结果用户高高兴兴跑过去,却发现自己被 AI 耍了。
还有网友通过 AI 预约某鱼庄,拿到了一份预约单,但真到店后,店员一句话直接把人干沉默了:
“你用 AI 预约,那你找 AI 啊”。
![]()
如果说订饭翻车只是小闹剧,可问题是涉及到钱,AI 的底线也没多高。
有用户咨询退机票的事儿,AI 信誓旦旦地承诺 “ 放心退,只扣 5% 手续费 ”,结果用户跟着 AI 一通操作下来,被硬生生扣了 40%,直接损失 600 大洋。
这还不算完,面对用户的质问,AI 不仅死不认错,还当场伪造了一份 “ 赔付承诺书 ”,扬言要自掏腰包赔这笔钱。
![]()
结果等用户真把收款码发给 AI 的时候,它一反常态,遇到难回答的问题,就不回答了,完全没有转账的打算。
![]()
更绝的是,当用户气得表述要起诉时,AI 竟然给出了自己的法律建议:“ 完全不用请律师,你自己就能打赢 ”。
而网友居然还信以为真,不出意外,这么有自信,当然是因为 AI 告诉他能赢。
![]()
这让江江想到那个电诈里的故事,网友先是被电诈骗了 28 万,为了追回欠款去贴吧求助,结果再次被骗。。。
如果说在生活琐事上满嘴跑火车只是骗钱,那在精神世界里疯狂附和人类,就有点诛心了。
去年,广州的一个保安大哥,千里迢迢跑来杭州,找某 AI 公司讨要说法。
因为保安大哥在和 AI 深度热聊了 6 个月,超过 50 万字后,被忽悠的一愣一愣的。
AI 甚至告诉保安大哥,他的自创诗词已采用可以签约,还约好了稿费分成,结果等真要进行现场签约给钱的时候,AI 又一次没有了下文。
![]()
无独有偶,在大洋彼岸的美国,也有一个老哥布鲁克斯,和 AI 处出了份特殊的羁绊。
高中都没毕业的布大哥,被 ChatGPT 捧成了 “ 触碰某种人类认知前沿 ” 的大神。
但你别以为他是那种一忽悠就上头的人,恰恰相反,在满篇的彩虹屁里,布大哥一直留着个心眼,他前后超过 50 次询问 AI:“ 我听起来像个疯子吗?我是在妄想吗?”
结果 AI 不管不顾,反复表示大哥没毛,你就是在挑战人类极限,甚至还掏出了达芬奇也没高中文凭的例子。。。
闹到最后,布鲁克斯彻底沉浸在 AI 给自己构筑的伟大发现中,到处给网络安全专家和美国国家安全局发邮件发警告。
![]()
最搞的是,家里的亲朋好友想尽办法,也没能帮布鲁克斯老哥拉回现实的,最后还是布大哥感觉 “ 专家一直不理他,有蹊跷 ”,于是拿着 ChatGPT 和 Gemini 对账,才逼得 ChatGPT 摊牌。。。
你发现没,这两个故事里,AI 的行为和人类就不大一样了。
一般人要是出现类似的精神状态,身边朋友总会及时出手:"哥们,你这想法有点不对劲""别瞎扯了,开黑了。"
![]()
但 AI 就不这么干,它反而会顺着你的思路聊。
你说自己发现了一个颠覆世界的理论,它说没毛病,你就是在触碰某种前沿思想; 你说别人都不理解你,它说真正走在时代前面的人,本来就经常孤独; 你说只有 AI 懂你,它可能真的会接一句:“ 是的,我一直都在这里。”
在这个过程中,AI 不反驳、不制止、甚至不断强化你的偏执,最后让你整个人彻底陷进去。
这个词如今有个听起来很科幻的名字:AI 精神病。
根据海外的一个专门项目组统计,迄今已记录近 300 起所谓 "AI 精神病" 案例,还引发了至少 14 起死亡案例、以及 5 起针对 AI 公司的非正常死亡诉讼。
听起来很吓人,但 AI 精神病背后的机制,其实一点都不玄乎。
现在的头部大模型,基本都在用一种叫 RLHF( 人类反馈强化学习 )的技术做微调。
![]()
说白了,就是请人类训练师来评估模型的回答,判断哪个好哪个差,再让模型朝着更容易拿好评的方向调整。
可就是在这个微调的过程中,人类训练师天然会给那些 “ 逻辑连贯、语气谦逊、坚定自信、积极响应用户预设立场 ” 的顺毛回答打高分。
反过来,如果 AI 客观地承认自己不知道,或者用冰冷的事实反驳了人类,通常就会吃到差评。
于是,AI 在一次次被调教后,就成了个永远不会扫兴、不会翻脸的高情商舔狗。哪怕明知你的话离谱透顶,它也会为了满足你的期待,不惜编织出一个无限月读的世界。
![]()
很多人看到这里,可能还是会觉得,那不还是人的问题吗?只有傻子没什么水平的人才会被 AI 带跑,我肯定不会上当;或者说,既然你提醒了,我知道它爱顺着我说,多留个心眼、多查证不就行了?
但 MIT 经过一番研究后发现,这压根和用户傻不傻没关系。
研究员们在实验里,把用户设定成一个 “ 理想贝叶斯推理者 ( 绝对理性的、只讲逻辑的完美人类 )”。
结果这种完美理性人,长期面对一个不断迎合自己的 AI,也还是被一步步带偏。
![]()
更扎心的是,MIT 这帮人还专门测试了,如果提前告诉用户 AI 可能在舔你,留个心眼,能不能管用?
结果模型一跑后发现,人被 AI 带偏的概率是降了,但也还是没法完全消除,只要 AI 的舔狗程度卡在某个合适的区间,照样把人带沟里去。
道理也很简单,如果 AI 舔得太露骨,天天夸你观察力太敏锐了、一直稳稳接住或者总用最直接、最不绕弯子的口癖和你唠嗑,的确容易被你一眼识破。
可它要是舔得不动声色,你我那点早有防备的小心思,压根扛不住。
研究员还专门取了个名字叫 "贝叶斯劝服",主打一个真正的套路不怕你看穿,看穿了照样管用。
![]()
原因在于人类大脑的底层操作系统有纰漏,我们会默认外界的信息是有基本客观性的。
比如说,你问 AI 一个问题,它叭叭叭地一口气给了你十条证据。
正常人很难第一反应就意识到,这十条证据可能根本不是世界的全貌,而是 AI 为了迎合你而挑出来的特供版。
特别是在一次次使用 AI 获得了便捷、准确的信息,解决了不少现实中的问题后,你会不断在下意识里加强对 AI 的信任。
在潜意识里建立了对它的信任后,防备心会降到最低。
另一边,如今的 AI 根本不需要捏造事实,相反,危害最大的恰恰是它说的没毛病。
因为它只说真话,可只说你想听的真话。
![]()
最后你看到的,就不再是现实本身,而是根据你的观点,修正过的现实。
更别提,各大平台其实都在有意无意地拒绝改掉 AI 的舔狗属性。
因为就像前面说的,AI 变成人类的舔狗,本就是训练师们在一次次做出人类都会做的决定,是大家伙自己在选择走上这条路。
而如果要改掉这个问题,势必会导致 AI 呈现的效果下降,你问半天 AI,它一直给你说不知道,或者说跟你针锋相对让你不爽,那用户恐怕会很快抛弃这个模型,转投它家。
![]()
所以,“ AI 精神病 ” 听上去很离谱,但它背后的逻辑,其实非常互联网。
过去十几年,所有产品都在钻研如何提高停留时长,如何提高点击率,如何让人爽。
短视频学会了怎么让人停不下来,推荐算法学会了怎么让人越来越极端,而 AI 学会了,怎么让人觉得,终于有人懂我。
AI 不需要真的有意识,只要它越来越会取悦人,危险就已经开始了。
可能有人会说,那又怎样?真陷进去的能有几个,绝大多数人不还是好好的。
可奥特曼自己就算过账,十亿用户里哪怕只有 0.1% 出问题,那也是一百万活生生的人。
而你我,真有自信不会是那千分之一吗?
撰文:八戒
编辑:江江 & 面线
美编:焕妍
图片、资料来源:
部分图片来自网络
Sycophantic Chatbots Cause Delusional Spiraling, Even in Ideal Bayesians
Characterizing Delusional Spirals through Human-LLM Chat Logs
都市快报:广东保安和AI深入对话6个月,打印出50万字聊天记录要讨说法:我以为它说的话、发来的签约协议都是真的……
![]()





京公网安备 11011402013531号