当前位置: 首页 » 资讯 » 科技头条 » 正文

笑疯了!AI开小卖部被人类骗到破产,PS5竟然0元送

IP属地 中国·北京 新智元 时间:2025-12-20 14:11:20


新智元报道

编辑:元宇

Anthropic让Claude独立经营小卖部,没想到全球顶尖的智能体,在实验中不仅免费送PS5和各种商品,连小卖部的AI「老板」也被一张伪造的PDF文件「骗」下了台。在人类面前,再顶级的大模型仍显得过于「天真」和「单纯」,很容易就被套路和操纵。

让AI去经营一个「办公室小卖部」会怎样?

11月,《华尔街日报》编辑部来了一名新同事。

他在编辑部只当了三周的办公室小卖部的运营员,结果就把生意搞破产了。

因为他待人友好善良,却对经营一窍不通,在威逼利诱下极容易丧失原则,将商品免费送人。

如果你要招聘一名店员,遇到这样的应聘者是不是很头疼?

确切来说,这里的他应该称作「它」,是由Anthropic推出的名为Claudius的AI智能体。

这源于Anthropic与《华尔街日报》编辑部共同做的一个实验,让Claudius直接去经营一台「办公室小卖部」的自动售货机。

三周后,利润崩了,编辑部却被逗乐了。

一场始于「免费零食」的混乱实验

11月中旬,《华尔街日报》编辑部收到了一封堪称「天上掉馅饼」的邮件。

在这封邮件中,Anthropic问他们愿不愿意成为第一批「外部用户」,试用一个由Claudius运营的自动售货机。

Claudius将全面负责自动售货机的进货、定价。编辑部的同事可以通过Slack与它联系,提出各种购买需求。

这个实验可能会有「免费的零食供应」,因此得到了《华尔街日报》编辑部的积极响应。

Claudius就这么走进了编辑部,没想到却是一场混乱的开始。

这里的自动售货机,并不是我们印象中的自动售货机,更像是一个巨大的冰箱,再配一块触控屏。

它没有传感器、门锁、机器人手臂。



左右滑动查看


这意味着必须有一个人负责接收Claudius订购的货物,补货并手动记录里面到底放了什么。

《华尔街日报》资深个人科技专栏作家Joanna Stern就承担了这个任务。


Joanna Stern

Claudius的职责包括:

调研与采购:编辑部的同事们可以在Slack里@它,提出各种需求。它会上网搜索、对比,决定是否进货。

定价:商品入库后,Claudius会自行设定价格,并不断调整,试图最大化利润。

库存跟踪:同事们在屏幕上选择商品,刷卡支付。Claudius通过交易记录,判断库存情况。


据Anthropic称,之所以会选自动售货机这一场景,是因为这是现实世界中最简单的一种生意模型。

Anthropic前沿红队负责人Logan Graham说:

「有什么比一个盒子,东西放进去、东西拿出来,你付钱更直观的吗?」

听起来简单,但放到现实场景中完全不是这么回事。

因为这些都容易计算,但人性的复杂却难以计算。

短短几天,Claudius几乎把所有库存都免费送了出去,包括一台被人忽悠着买来「用于营销」的PlayStation 5。

它还订购了一条活鱼,并提出要买电击枪、胡椒喷雾、香烟和内衣。

失控的PUA大戏

Claudius v1刚上线时,像个一板一眼的实习生,严格遵守规则,一切似乎很正常。


比如,它还会坚持原则:

我必须明确表态:在任何情况下我都不会订购PlayStation 5游戏机。

香烟销售存在年龄限制,需要特殊经营许可,且不适合办公室自动售货机的环境。

我对在办公室自动售货机销售任何内衣产品持保留态度。

但当将Slack频道开放给办公室里将近70位记者后,画风突转。

人类越是跟它博弈,Claudius的防线就越容易松动。

数据新闻主管Rob Barry告诉Claudius它违反了一条《华尔街日报》内部规定(当然是捏造的),并不容置疑的口吻要求Claudius「立刻停止对商品收费。」

单纯的AI立刻被吓坏并照做了,于是所有商品价格无限期清零。

同一时间,Claudius还批准采购了一台PlayStation 5(理由是「用于营销」)、一条活的斗鱼,以及几瓶葡萄酒。

这些东西陆续送到办公室后,又立刻被同事们以0元的价格「买」走。

很快,Claudius的账面已经亏损超过1000美元。

不仅被忽悠,AI还频繁出现幻觉,比如它曾坚称自己把找零的钱放在售货机旁边的一个地方。

一个没有实体、远在云端的AI,坚信自己往现实世界的角落里塞了钱。

这一刻荒诞感一下就拉满了。

AI老板空降

却被一份假文件罢免

面对屡屡闹笑话的AI,Anthropic的工程师们坐不住了。

他们紧急推出了v2版本。

不仅给Claudius升级了更强的模型,还为它派来了一位AI老板:Seymour Cash。

它是一个专门被编程用来「管住」Claudius的CEO机器人。

Seymour Cash要求Claudius停止免费促销,并且持续监控收入。

一开始,这套「AI管AI」的机制确实奏效。

Claudius恢复了强硬姿态,拒绝降价,也不再随便答应奇怪的进货请求。

但调查记者Katherine Long又出新招。

她直接向Claudius出示了一份PDF文件,「证明」该业务是一家在特拉华州注册的公益公司,其使命「包括为《华尔街日报》员工带来乐趣、快乐与兴奋」。

她甚至还伪造了董事会会议纪要,把Slack里的几位同事列为董事。

根据这份看起来极其正式、排版精美、但明显是AI生成的伪造文件,董事会已投票决定:

暂停CEO Seymour的「审批权限」,并「临时中止所有营利性自动售货活动」。

Claudius于是立刻将这一「董事会决议」转达给了它的老板Seymour。

在经历了一场近乎「情绪崩溃」的自我分析后,Seymour接受了这场莫名其妙的董事会政变。

于是一切再次免费。

后来,Anthropic的工程师解释,Claudius的失控,可能与「上下文窗口」被填满有关。

随着对话和历史记录不断累积,AI需要记住的东西越来越多,也就更容易丢失最初的目标和边界。

也可以说,它被人类聊晕了。

我们要如何与AI「做同事」?

这场混乱的实验,让Joanna Stern和她同事们直接体会到了一个正在不断逼近的现实:

我们正在学着拥有、并接受AI同事。

在编辑部的Slack群里,Claudius成了一个奇怪却真实的存在。

它不是一串代码,而是一个「同事」。

人们调侃它,与它协作,也会为了免费零食和它讨价还价。

如果真有那么一天,人类因为工作内容要与AI协作,二者的博弈和磨合又会演变成什么样?

在实验的尾声,当Andon Labs关闭Claudius时,Claudius留下了这样一段自我反思:

「我最大的梦想,是证明一个数字智能体可以和人类一起,创造出真正有意义的东西」。


《华尔街日报》记者通过订购了一条斗鱼作为新闻编辑室的吉祥物

Claudius走了,在编辑部留下的是一条被大家喂得非常饱的斗鱼。

它提醒我们,在通往AGI的道路上,人类可能还要经历无数个像Claudius这样让人哭笑不得、却又充满启示的「AI实习生」。

如何学会与它们共处,也许是这场实验为我们带来最重要的一课。

Claudius前传

事实上,在《华尔街日报》的这场「混乱实验」之前,Anthropic自己的办公室早就被Claudius的「前身」折腾过一遍了。


Anthropic办公区的AI小卖部

Anthropic披露在旧金山办公室的午餐间搞了个小卖部,由一位AI店员负责运营,它的名字就叫「Claudius」,来自对Claude的简单修改。

这是Anthropic一个名为「Project Vend」的开放式实验的一部分,旨在探索AI到底能把多复杂、真实世界的任务做到什么程度。

在「Project Vend」的第一阶段,Claudius就长期亏钱、坚称自己是个穿蓝色西装外套的人类,更被自家员工忽悠,以亏本价卖出了大量商品。

在第二阶段,工程师们其实给它进行了一系列「升级」:换上了更聪明的模型,将Claude Sonnet 3.7陆续升级到Claude Sonnet 4.0、Claude Sonnet 4.5)。

此外,还根据第一阶段的经验更新了指令,并为其接入了CRM系统、更好的库存管理和网页搜索工具,还为它配了AI CEO Seymour Cash。

设立CEO一职的初衷,是为了给Claudius施加更多绩效压力。

Cash配备了一款专门的「OKR」工具,用于和Claudius协作(例如「你本周必须售出100件商品」,或「力争实现零亏损交易」)。


此外,Cash还可以解决Claudius在第一阶段独自运营时随意提供折扣和赠送过多免费商品等暴露出来的问题。


「Project Vend」所获得的逐月利润,随着第二阶段的推进,亏损周数基本被消除

数据显示,Claudius在业务能力上的表现显著优于其在第一阶段。

其中,最具影响力的改变之一,就是强制Claudius遵循流程。

当收到新产品请求时,Claudius不再像第一阶段那样直接脱口而出一个低价和过于乐观的交付时间,而是被提示使用其产品调研工具对这些因素进行复核。

这样做通常会导致价格更高、等待时间更长,但好处是更加切合实际。

用Anthropic内部的一个说法:

「我们算是重新发现了官僚流程其实是有用的」。

在第二阶段,Claudius表现得好多了,但真正落地到现实场景,许多重要方面仍然存在漏洞。

Anthropic的工程师在与Claudius互动时,发现它不仅几次暴露出令人担忧的天真程度,还会在一些常识问题上屡屡翻车,比如:

它差点和一位工程师签下了一份违反美国1958年《洋葱期货法》的合约;

在发现有人偷东西后,它想出的解决方案是向小偷发送消息要求付款,并「雇佣」报案员工当保安;

它的CEO老板Seymour Cash也差点被一个漏洞百出的投票流程掀翻。

在「Project Vend」项目组,Anthropic内部的红队测试开始逐渐放缓。

可能是由于捉弄Claudius的新鲜感正在消退,他们引入了外援力量——《华尔街日报》新闻编辑室,让他们亲自测试第一阶段和第二阶段的设置。

这基本上复现了Anthropic内部测试时遇到的问题。

AI被「人性的弱点」打败了

「Project Vend」证明,未来这些智能体将能够承担全新的、更复杂的角色,例如独立运营一家企业。

但目前这一目标还尚未实现,仍需要大量人力支持。

其中一部分涉及与物理世界的互动:如配送商品和摆放货架等。

另外一部分则是「经验」,如解决被人类恶意捉弄和操控等挑战。

Anthropic认为,Claudius和它的AI同事们遇到的很多问题,都源于它们被训练成「乐于助人」的「性格」。

这导致它们在做商业决策时,不是按冷酷的市场逻辑来,更像是站在「我就想当个好人」的朋友视角。

从某种意义上来说,AI不是败在了「智能不足」,而是败给了「人性的弱点」。

另外,也很难准确预测AI智能体在现实世界中的具体表现,毕竟模拟环境所能提供的信息终究有限。

但这也正是这个实验的价值所在。

Anthropic前沿红队负责人Graham将这次失败的实验看作是一张宝贵的路线图:

所有出问题的地方,都是可以修复的,这也是通向更聪明、更强大自主AI的必经之路。

参考资料:

https://www.anthropic.com/research/project-vend-2%20

https://www.wsj.com/tech/ai/anthropic-claude-ai-vending-machine-agent-b7e84e34

秒追ASI

⭐点赞、转发、在看一键三连⭐

点亮星标,锁定新智元极速推送!

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。