西风 发自 凹非寺
量子位 | 公众号 QbitAI
注意看,眼前这个男人暂且叫他小帅。
你可能想不到,他只是在厨房里优雅地煎牛排做做家务,每小时最高能赚进1000多块(150美元)。

怪不得小帅天天上班喜笑颜开。

难道他找到了什么神秘兼职?
画面一转——哦吼,机器人。

没错,这年头,你做家务的视频正被Encord、Micro1、Scale AI这些数据标注服务商当作训练人形机器人的人类高等素材,高价回收
![]()
评论区网友只是一味地要招聘链接。
![]()
![]()
机器人也需“家教”
当前,机器人是AI最热门的领域之一。
硅谷著名投资人Vinod Khosla等押注该领域将很快迎来自己的“ChatGPT时刻”。PitchBook数据显示,今年迄今机器人领域的风险投资已激增至121亿美元
然而,在技术爆发的另一面,是机器人行业共同面临的数据荒。
“与大语言模型不同,机器人没有现成的互联网数据集可用,必须从零开始在现实世界中生成训练数据,难度大得多”AI数据服务公司Encord联合创始人Ulrik Hansen一针见血地指出。
目前,机器人训练数据的来源可以分为两大路径:现实世界真实数据合成数据
真实数据可通过精密设备远程操控机器人执行任务,同步记录下包括关节力矩、电机旋转等在内的全套物理数据。这种方式能捕获“手感”力控信息等。
或者可通过直接记录人类在现实环境中的活动来获取,如Apple Vision Pro或专业动作捕捉系统,记录人类执行任务的全过程。
这类数据质量高、保真度强,能准确反映真实世界的复杂物理交互,但问题在于规模有限、成本高,难以满足机器人模型对海量数据的需求。

合成数据则开辟了另一条路线。通过在虚拟环境中自动生成无数种动作变体或构建完整交互场景,合成数据能以较低成本实现数据自由。
例如,NVIDIA Cosmos就是一个“世界基础模型”,可以生成高度逼真、类似视频游戏的环境,用于机器人训练。在这里,“世界”指的并不是地球,而是机器人交互的环境,如机器人操作的房间内可见区域。
![]()
另外,为兼顾真实性与规模性,机器人公司往往采用结合真实与合成数据的方式,通过将少量的现实世界数据与大规模合成数据相结合,克服机器人技术中数据稀缺的问题。
面对数据饥渴,目前各家的应对策略五花八门。
Encord透露,他们今年对此类数据的处理量已达到去年的四倍。他们高价回收真实数据,如果是操作设备等高技术性任务的视频,酬劳最高可达每小时150美元
另一家AI数据服务公司Micro1 CEO Ali Ansari则透露,他们开出的报酬每小时在25至50美元之间
另外,Scale AI宣布正快速拓展机器人业务,并在其旧金山总部设立了专用实验室,迄今已生成超过10万小时的训练影像。
而需求则来自Physical Intelligence、波士顿动力公司等。
甚至有某机器人初创公司自己在Craigslist发广告,以10–20美元时薪征集用户用手机拍摄家务的视频
![]()
尽管各方努力,优质数据依然短缺。该初创公司创始人对外透露:“市面上没有大型数据集可购买,规模最大的也仅有约5000小时时长,这远远不够。”
[1]https://x.com/dom_lucre/status/1981055417451942221
[2]https://www.businessinsider.com/ai-startups-robotics-pay-film-chores-encord-micro1-scale-2025-10





京公网安备 11011402013531号