当前位置: 首页 » 资讯 » 科技头条 » 正文

Manus 最新对话全文:尝试 Agent 支付,公司 RRR 近 1 亿美元

IP属地 中国·北京 编辑:陆辰风 极客公园 时间:2025-08-20 16:13:17


万物 Agent 的时代,Manus 又快了一步。


作者|Li Yuan

编辑|靖宇


搬到新加坡的 Manus,对通用 AI Agent 的思考没有停止。

在今天在新加坡举行的 Stripe Tour 上,Manus 联合创始人兼首席科学家季逸超(Peak)与 Stripe 亚太地区及⽇本⾸席营收官 Paul Harapin 进行了对谈。

席间,ManusAI披露了近期的经营数据,Manus AI 年度化的经常性收入(RRR,Revenue Run Rate)已经达到 9000 万美元,很快即将上亿。

Manus AI 的肖弘还特意在即刻表示,Revenue Run Rate 指的是当月的 Revenue *12,并不等于 Cash Income。很多 AI 产品都会有年付选项,这部分只能算作预存款,而不能记为 Revenue。「如果我们按照这种披露,可以算出一个一个比 1.2 亿美金更大的数。」肖弘表示。

除了经营数据之外,季逸超还分享了 Manus 团队是如何思考通用 Agent 的的下一步的,以及 AI Agent 和 AGI 未来到底有什么区别。

「现在大家几乎把一切都叫做 Agent。比如一个麦克风,有人会叫它是「有环境感知的收音 Agent。」季逸超开玩笑地讲道。

他也给出了拓展通用 Agent 能力下一步的两条主线:其一,用多 Agent 协作把执行规模做宽(如在大规模调研里衍生出上百个并行的子 Agent);其二,给 Agent 打开更大的「工具面」,不把能力绑死在少数预置 API,而是像程序员一样调用开源生态、安装库、甚至在可视化后看图自检并回改

季逸超还提到,今天的数字世界仍按「给人用」的范式建造——非 API 化网页、CAPTCHA、流程「小游戏化」带来大量摩擦,瓶颈更像生态与制度约束,而非模型智力

这也是 Manus 参与 Stripe 活动的原因之一:双方正推进在 Agent 内完成支付,把「研究—决策—下单/结算」连成闭环,用基础设施协作来消解世界的摩擦。

以下为对话精华,经极客公园编辑整理:

问:给观众简单介绍一下你自己吧。你最近关于「上下文工程」的博客非常鼓舞人心,我觉得对于在座任何正在开发AIAgent 的人来说都是必读的。我每次去和工程师们吃午饭时,他们总是在谈论这个,所以我现在只能坐到别的地方(笑)。但对于现场可能不太熟悉 Manus 的人,你能分享一下你的经历和愿景吗?

答:谢谢 Paul。很高兴能来到。Manus 在构建一个通用 AI Agent。

很多研究机构和公司,其实在尝试打造一个大脑——打造一个大语言模型。但我们认为,从消费者的角度来看,这其实并不好。AI 应该能真正采取行动,完成事情,所以我们构建了 Manus。

我们的方式,是让 AI 可以使用人类历史上最伟大的发明之一——通用计算机。给了 AI 计算机,它能做人类能做到的所有事。Manus 能真正完成任务。比如它可以帮你做演示文稿、帮你规划一次旅行,甚至能帮你运营社交媒体——虽然我并不推荐你真的这样做。

我们的用户真的很喜欢 Manus。我们在三月份发布了 Manus,现在已经实现了大约 9000 万的年度化的经常性收入(RRR,Revenue Run Rate),很快就会突破 1 亿。

我觉得这对我们这样一个小型创业公司来说非常巨大。但更重要的是,这表明 AI Agent 已经不再只是一个研究领域的流行词,而是真正在被应用,落地生根。

我可以和大家分享一个我们构建 Manus 过程中的小故事。

我们其实从 Agent coding 的应用中得到了很多灵感。比如像 Cursor 这样的 AI 编程产品,之前已经吸引了很多关注。

作为工程师,我们自然会使用 Cursor。但让我们惊讶的是,公司里很多非工程师同事也在用 Cursor。当然,他们并不是在写软件,而是用它来做数据可视化,甚至写一些文章。他们会忽略左边的代码部分,只是跟 AI 对话来完成工作。

这让我们意识到:我们应该把这种方式泛化,赋能非程序员。这就是 AI 的一个用例。

问:我们越来越常听到人们谈论AIAgent 和 AGI。你能不能帮我们更清楚地区分这两个概念?AI Agent 和 AGI 对你和 Manus 来说各自意味着什么?

答:我们认为这是一个非常好的问题。

现在大家几乎把一切都叫做「Agent」。比如一个麦克风,有人会说它是「有环境感知的收音 Agent「。

但至少我们主张,Agent 应该是应用型 AI 的一个子集。我们不妨退一步,看看常见的 AI 应用类别。

大多数人已经熟悉两类:一类是聊天机器人,比如 ChatGPT;另一类是生成式工具,比如 MidJourney 或 Sora。在这些系统中,通常只有两个角色:用户和模型。你和模型交互,得到输出。而 Agent 的不同在于,它除了用户和模型,还引入了第三个关键元素——环境。

这个「环境」的概念会因智能体类型不同而变化,比如在设计型 Agent 里,环境可能是一个画布或一段代码;而在 Manus 这里,我们的目标是让 Agent 出现在虚拟机甚至整个互联网中。这样 Agent 就能观察环境,决定下一步该做什么,并通过行动来改变环境。这让它非常强大。

比如在 Manus,你可以表达需求,它会打开浏览器、发布网页、帮你订一张机票。我很喜欢这个例子,因为虽然订机票听起来很简单,但这其实是 AI 在直接改变现实世界——结果不是模型的输出,而是你手里的机票。AI 真正介入了你的世界。这就是我们所说的 Agent。

简单来说,Agent 就是能代表用户与环境交互的 AI 系统。

至于 AGI,这个词也经常被提到,很多人把它等同于超级智能。我们认为,AGI 是一种能利用 AI 模型的通用能力,在不经过特别设计的情况下完成许多任务的系统。

我们认为「Agent coding」其实是通往 AGI 的一条路径。它不是一个垂直领域的能力,而是如果你把它赋予计算机,它几乎能在计算机上做任何事。所以对我们来说,AGI 的条件就是要构建足够完善的环境,让这种能力得以发挥。

问:AI今天究竟在哪些场景中真正发挥了作用?未来会在哪些地方发挥作用?什么时候会出现 iPhone 时刻?

答:就 Agent 而言,如果单看模型能力的话,现在的旗舰模型已经非常惊人了,几乎是「超人」级别的。它们可以在数学竞赛或逻辑推理上胜过我们大多数人。

但我认为,模型仍然像是「瓶子里的大脑」,如果想真正发挥力量,就必须让它们与真实世界交互、触达现实。但不幸的是,这正是问题开始的地方。

比如你让一个 AI 去做一些事务性的任务,它在重复性任务上确实很擅长。比如像 Deep Research 这样的产品,它只是聚合信息然后给出一个结果,它的输出只是简单地出现在那里。

举个例子,现在几乎所有东西都是为人类设计的,不只是物理世界,甚至数字世界也是这样。比如网页工具,它们就像小游戏一样,没有提供 API 或标准接口。验证码 CAPTCHA 无处不在,处处在拦截 Agent。

所以我认为 AI 在封闭的自包含任务中表现很好,但一旦涉及真实世界,就会遇到障碍。

未来什么时候能出现 iPhone 时刻?我觉得这并不是技术问题,而是更像是一种制度性限制。这不是像我们这样的 Agent 创业公司能够单独解决的事情。

我认为这需要一个渐进的转变,要求整个生态系统共同进化。这也需要像 Stripe 这样的公司在基础设施层面发力。比如我们正在集成新的 stripe 的 Agentic 支付 api。大家共同努力。

问:那我们能不能具体谈谈用户在使用 Manus 时的一些典型场景?他们是如何使用的?这其中体现出了怎样的力量?

答:是的,我们虽然来自当前这一代 Agent,但已经看到很多很棒的用例。

比如说,我们刚刚搬到新加坡,需要雇佣房产中介来帮我们找住所。是真人 Agent(笑)。

而现在这些中介已经在使用 Manus:他们会根据客户的需求,用 Manus 来分析公司所在地、员工想住的区域,并生成相应的推荐。

我觉得这很有意思,因为这属于一种「长尾需求」。一般来说,并没有专门的 AI 产品是为这种具体场景设计的,但由于 Manus 是一个通用型 Agent,它就能满足这些需求。我们认为长尾需求非常值得关注。

从宏观角度看,它可能是长尾,但对具体用户而言,这正是他们的日常工作。这种场景特别有价值。

这就像今天的搜索引擎格局一样。如果你只是搜索一些常见的内容,不管用 Google 还是 Bing,结果质量差不多。那为什么人们会选择其中一个?可能是因为某个搜索引擎在特定时刻给了他们更合适的结果。而如果你搜索的是非常个性化或专业化的内容,就更能体现差异。所以我们认为通用型 Agent 的优势就在这里。

那如何让它更好呢?我们思考了很久,因为我们认为一切都绕不开编程。如果你把计算机交给 AI,那么它与环境交互的方式其实就是通过编程。

我们认为可以从两方面改进。第一是规模化。但如果你能把 Agent 的能力放大一百倍会怎样呢?

最近 Manus 刚刚发布了一个新功能,叫做 Wide Research。它的基本思路是允许一个 Agent 再衍生出上百个 Agent 一起去完成任务。你知道的,如果只是让AI帮你做一些小事,很多时候你自己也能完成。但如果任务非常庞大,你一个人根本不可能完成,比如需要做大规模的研究,这时候让上百个 Agent 并行去做,就会变得非常强大。

其次,我们还需要让 Agent 更灵活地使用计算机使。比如,如果你只给一个 AI Agent 设置了预设工具,那么它的行动空间就被限制在这些工具里。但想象一下,如果你是一个程序员,你有整个开源社区的资源可以调用。

比如你在 3D 打印的时候,直接修改模型的参数很困难,但是你如果能找到 GitHub 上的合适的库,直接安装就能解决你的问题了。在 Manus,我们在优化通用性,并且提出了一个概念,叫做「工具的网络效应」。

有一个很有意思的例子:很多用户在用 Manus 做数据可视化。你们知道,在亚洲有时候会遇到问题,比如在图表中显示中文时可能会出现字体错误。或许有些专业用户会写一些硬编码规则,比如在输出韩文时应该用哪种字体。但这种方式会让系统越来越僵化。

我们采取的办法是给系统增加了一个很简单的能力:查看图像。结果很惊喜——因为今天的模型已经很聪明了,它们会在生成可视化图像后自己检查,并意识到错误,然后再自动修正。我们发现,增加工具的灵活性比硬编码规则能解决更多的问题。

问:这是一个令人兴奋的时代。我真的很激动,只希望自己能再年轻到三十岁(笑)。提到医学研究的,我知道 Manus 在这方面也很强。你们观察到有些用户在使用 Manus 研究医疗吗?

答:很多人已经在用 Manus 做研究,不仅限于医学研究。我们觉得这很有意思,因为现在确实有很多所谓的「深度研究」产品,它们会帮你收集大量信息并做一些分析,但最后只给你一个 markdown 文件或文档。这远远不够。

很多时候,研究人员真正需要的,是能够直接交付给老板或团队的成果。所以我们在 Manus 上加强了研究结果的输出。例如在医学研究中,很多时候需要生成正式的报告,比如幻灯片报告之类的东西。因此我们必须优化 AI 的输出能力,以满足研究人员的需求。这是一种「工具化」的体验。

比如现在很多用户会先用 Manus 做研究,然后直接生成一个网站。你会觉得这和传统的网站搭建方式完全不同。

要知道,搭建一个网站本身其实不难,难的是如何确保数据的可靠性和准确性。所以我们认为,最好能在一次会话、一个共享的上下文中完成整个流程。这样,你的研究、你的见解就能无缝转化为最终成果。这就是我们在 Manus 里所做的事情。

问:很多国家都在讨论一个话题:在AI时代,人类的未来和经济影响。你怎么看待就业被取代?又会出现哪些新的工作机会?

答:我们的朋友和投资人也经常问我们这个问题。当我们推出 Manus 时,最初认为如果能构建这样一个 Agent,它就能帮人们节省很多时间,让大家轻松赚钱。

但实际上,我们发现这个愿景并没有完全实现。通过大量用户调研,我们发现用户在使用之后,他们反而工作得更多了。因为他们变得更高效了,他们实际上能做更多他们本来就很擅长的事情。这是第一点。

其次,我们认为 Manus 还打开了一个全新的空间。我们一直在讨论虚拟机和云计算。我们觉得 Manus 正在扮演一种「个人云计算平台」的角色。比如云计算已经存在几十年了,但它更多是工程师的特权,只有我们能通过编程来调用云的力量。普通知识工作者无法使用。

但现在有了像 Manus 这样的 AI Agent,人们可以用自然语言下达指令,让 AI 去执行。这等于解锁了一种全新的生产力。这就是我们所带来的。

而最后,关于「替代」,我认为其实很难。比如房产中介,他们每天都在用 Manus 完成日常工作。但你知道,AI 永远无法替代中介面对客户时的那种沟通方式。我们是一家 AI 公司,甚至 Manus 的发布视频都是由 Manus 写的脚本,但视频里出现的还是我,因为这是关于信任的事情。而信任,是不能完全交给 AI 的。

*头图stripe

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你觉得 Agent 能突破机器人和支付限制吗?

小米二季度财报发布,营收 1160 亿元,经调整净利润 108 亿元。

点赞关注极客公园视频号,

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。