当前位置: 首页 » 资讯 » 科技头条 » 正文

一场极致的算力成本压测

IP属地 中国·北京 虎嗅APP 时间:2026-06-18 02:08:46


出品|虎嗅科技组

作者|陈伊凡、解丹青

编辑|苗正卿

头图|AI生成

这是虎嗅WAIC“追踪Token商业新范式”系列文章第期

“如果日均建模数80000次,每次两毛钱,每天花费16000元,如果是一个月,就是48万元。”

在说起算力消耗这个话题时,Remy创始人王正男掏出了手机,很认真地算了笔账,如果放在英伟达的显卡上跑,每个月固定消耗50万元。

对于一家创业公司来说,这笔Token消耗是不小的开销。这是建立在所有任务都跑在英伟达的显卡上。严格意义上说,Remy所做的事情跟Token的关系并不大,但Remy的生意,却与算力的消耗息息相关,甚至关系到这家公司的关键商业模式。王正男有他自己的一套控制成本的方法。

“我们从去年年底至今,半年时间,Remy的用户数达到了250万。”但王正男在思考另一件事,他就像一个精力无限的陀螺,语调昂扬,眼里有光。


Remy在2025年华为开发者大会(HDC2025)亮相

未来的Remy,要跟抖音和小红书争夺入口,这是个听起来“螳臂当车”的事,但并非不可能。我们在讨论这个极致算力成本控制案例时,也与王正男聊到了Remy的未来。

“我们从去年年底至今,半年时间,Remy的用户数达到了250万。”但王正男在思考另一件事,他就像一个精力无限的陀螺,语调昂扬,眼里有光。

Remy的算力账本

大模型烧Token,每次推理调用一次API,按调用量计费,可复用,可以并行,成本曲线相对可预测。Remy不是这个逻辑。

3D重建的每一次任务,都是一次独立的训练过程。用户扫了一个场景,服务器就要为这个场景从零开始跑一次高斯泼溅训练;下一个用户来了,再跑一次,两次之间毫无复用。Remy现在的三种模式里,物体模式平均5分钟出结果,人像模式10分钟,大场景40分钟——每一分钟,都在消耗GPU时间,对算力的消耗甚至比和大模型对话还多。


使用Remy记录下曾经陪伴寒窗苦读的课桌在B站获得大量观众共鸣

“我们的成本其实不是Token,而是GPU。”王正男说,“我们跑的是自己的高斯泼溅模型,购买的是显卡时间和电力。”

这就带来了一个普通SaaS公司不会遇到的麻烦:波峰和波谷。

2025年10月22日,Remy在国内首次上线。按王正男的话说,接下来96个小时堪称“失控”。上线第五秒,他们预备好的八九百张显卡全部拉满,排队任务数量眼看着直线往上涨。最终,他们在弹性算力平台上把算力扩到了1900张GPU,才勉强稳住局面。9天之后,Remy用户量突破100万。

"如果我去向大厂每个月租1900张GPU,显然不划算,因为峰值之后根本用不到这么多。"

所以,最划算的办法是把3D重建部署在弹性算力平台上,王正男选择了一家叫做共绩科技的公司,这种弹性算力的模式叫做“算力滴滴”,算力资源像打车一样,按需调度,用多少取多少,峰值结束就释放。价格是美国同类弹性算力公司的十分之一。这样,他每个月的算力成本可以控制在20万-30万元。

2月10日的那次功能升级,Remy推出了3D全家福和房间扫描功能,用户可以通过Remy 3D的记录自己曾经生活过的老房子以及与父母亲人团聚的时刻。正值春节,流量再次暴涨。每10分钟处理200次任务,每次大场景重建需要40分钟,这意味着任何时刻都有800张显卡没有停歇地在跑。但依然是,当春节接近尾声,用户的使用频率就会下降,如果按固定购买的逻辑囤卡,这个账根本没法算。

Remy的商业模式

王正男至今坚持不向用户收费。


王正男本人 图片由Remy提供

让王正男重新想清楚商业模式的,是一个意料之外的数字。Remy每日的3D扫描数,是日活用户数的1/10。

也就是说,十个打开Remy的用户里,九个在“看”,只有一个在“拍”。

这个比例,最初让他困惑。3D重建的直觉逻辑是:你来是为了记录,不记录来干嘛?但数据显示,大量用户登录之后,只是在浏览或者反复翻看自己此前留下的记录。

想明白这件事之后,他对Remy的定义发生了根本性转变:Remy不是一个工具,而是一种新的记忆媒介。

“工具产品解决效率问题,适合订阅收费。但Remy是在帮用户记录人生、保存记忆,这和效率没有关系。”

这个判断,直接否定了订阅模式。

订阅制的逻辑是:你付月费,我通过产品来提升你的效率。这是Photoshop的逻辑,是Notion的逻辑,是所有生产力工具的逻辑。但Remy的用户,记录一段孩子的童年、一套老房子的房间,然后打开来看,不是为了提高效率,他们在消费记忆。

消费行为,对应的是流量模式。

“广告一定是一个方向。包括开屏广告、上传等待广告。只要用户规模起来,就会产生商业价值。"他说,“我更相信流量模式,而不是订阅模式。"

虽然现在所有用户都会记录,但不会天天记录。记录天然是低频行为,因为用3D的方式来记录天然有门槛。想明白了这点,王正男决定,未来如果想提升留存率和用户价值,必须让用户从“拍”转向“看”。

最近Remy添加的沉浸声场功能,就是想让3D记忆有更多情感的元素。在 AI 时代,大模型模仿人说话、拍视频,但人类复杂的情感它们模仿不了。因为这是各种经历产生的“化学反应”,我们想用技术将这个“化学产物”保存下来。

最近Remy添加的沉浸声场功能,就是想让3D记忆有更多情感的元素。在 AI 时代,大模型模仿人说话、拍视频,但人类复杂的情感它们模仿不了。

王正男要解决的是,为什么这些人会每天打开Remy,而不是打开抖音或朋友圈?这个问题,他自己还没有完整的答案。“3D内容对比2D内容到底有什么独特的价值,这是我今年要重点回答的问题。”

以下为虎嗅的对话精选:

虎嗅:过去半年,你对Remy最大的认知变化是什么?

王正男:最大的变化是我越来越确定,Remy不是一个工具产品。过去大家会把它理解成3D扫描、3D重建或者空间记录工具,但现在我更愿意把它理解成一种新的记忆媒介。工具产品解决效率问题,因此适合订阅收费;而Remy是在帮助用户记录人生、保存记忆,这和效率没有关系。

虎嗅:为什么你反复强调“记录”而不是“生成”?

王正男:因为我认为生成是创作者的需求,记录是所有人的需求。生成式AI主要服务于创作者,他们用AI生成图片、视频、内容来表达和传播。但记录是所有人都会做的事情。我们会拍父母、拍孩子、拍毕业典礼、拍老房子,因为这些时刻以后可能再也不会出现。

虎嗅:很多人会问,照片和视频已经存在了,为什么还需要3D?

王正男:因为人类一直在追求更真实的记录方式。黑白照片变成彩色照片,照片变成视频,视频变成沉浸式内容,本质上都是同一个方向。

我经常讲一句话:记录也许是对抗时间唯一的武器。时间会带走很多东西,人们之所以记录,是因为知道很多场景不会再出现第二次。我们希望Remy能够让这些记忆保存得更真实。

虎嗅:为什么在Remy以前没有成功的3D内容社区?

王正男:因为没人回答一个问题:用户为什么要看3D内容。

如果只是把一个东西变成3D,那并不足以支撑消费行为。视频更方便,图片更轻量,传播效率也更高。

虎嗅:现在最大的产品挑战是什么?

王正男:使用频率。现在很多用户会记录,但不会天天打开。记录天然是低频行为,因为创作有门槛。未来如果想提升留存率和用户价值,必须让用户从“拍”转向“看”。

虎嗅:Remy未来的目标是什么?

王正男:不是生成一个不存在的世界,而是尽可能1:1还原真实世界。

AI 行业开始认真算账了。不是只看模型能力,而是看 AI 是否真正进入业务、产生结果、跑出回报。

这也是虎嗅想追问的:钱烧哪了?干成啥了?赚还是亏了?能复用吗?

围绕这四问,我们将深度对话AI产业链条上的重要公司,沉淀AI账本样本库;还将在7月WAIC期间推出系列直播、闭门会,与企业关键决策者共探AI生意。

详情请戳,一起见证AI时代商业落地的真实变化。


本文来自虎嗅,原文链接:https://www.huxiu.com/article/4868069.html?f=wyxwapp

声明:包含AI生成内容

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新