
摘要:
“不用怀疑,机器人进家(这件事)有生之年肯定会发生的。”
科技 出品
作者|赵子坤
编辑|董雨晴
7月27日,腾讯 Robotics X 实验室与福田实验室联合发布具身智能开放平台 Tairos “钛螺丝”,这是国内首个以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台,通过“sdk/api”的方式面向机器人行业开放。
Tairos平台包含模型算法和云服务两大组成部分,模型层面包含了多模态感知模型、规划大模型以及感知行动联合大模型;云服务平台则包含了仿真平台、数据平台以及开发工具等,平台通过标准化接口调用及软件开发工具包(SDK)的方式对外提供服务。
当日,腾讯 Robotics X 实验室发布会现场,搭载了具身智能开放平台Tairos的宇树机器人G1走上台前,配合腾讯首席科学家、Robotics X 实验室主任、福田实验室主任张正友一起来做产品介绍。
在演讲的最后,张正友问身边的G1机器人,“结束后晚上要不要去喝一杯?”
它一板一眼回答:“不了,太忙了,今天还要加班。”
当日下午,在接受科技在内的媒体采访时,张正友也对此回答感到惊讶,“之前的彩排它不是这么说的,每一遍跑的(回答)都不一样。”
这是腾讯Robotics X实验室成立7年,实验室负责人少有的接受对外公开采访。他依旧坚定认为,养老场景是最适合做技术探索的场景,“为什么选养老,这是一个很难人机交互场景,我们是想用比较难的场景去切入做技术研发。”
“不用怀疑,机器人进家(这件事)有生之年肯定会发生的。”张正友说。
在这个时间节点,腾讯拿出了此前积累的技术成果,做成具身平台开放对外。“与其说商业化,我们更乐于提产品化。商业化听起来,是要赚钱。我们不是以赚钱为目的的。我们希望把自己变成一个稳定的产品,推动全行业发展。”
但他也强调,研发不能被产品化压力带着跑,并打趣道,“如果当年马化腾先生让我成立一个机器人实验室,立马做产品,我可能就不会来了。”
面对近来的人才流失,张正友坦诚,“确实现在外面吸引力很大,但我们跟初创公司不太一样,非常支持年轻科研人员的前沿探索,这个(科研)环境,在中国是很难得的。”
面对行业内的“四足”和“双足”路线之争,张正友则强调,“我(之前)做机器狗,不是为了做机器狗,是为了长远的理念。”
在他看来,未来具身智能的实现不一定只有纯足式、轮式的形态。曾经,人类是为了适应原始环境进化成了“双足”,而在当下的人居环境中,双足的效率不一定最佳。仅考虑“人形”反而会限制机器人的未来发展可能。因此,腾讯探索足式人式一体化方案,把“轮”和“足”结合,应用到腾讯家居环境原型机器人“小五”上。
而相比于初创企业对具身智能行业“iPhone时刻将到来”的普遍乐观,张正友显得更加犹豫和谨慎。
“现在连距离所谓的‘大哥大’时代还有多远都不好说……但在安卓、iPhone出现之前,难道BlackBerry(黑莓手机)的‘失败’就是没有价值的吗?”
他希望,腾讯能够通过发布Tairos平台,加速行业进入“大哥大”时代。“无论是我们认为的养老场景,还是别家说的工业场景,无论怎么样,都希望助力大家尽快提高量产数量,把成本降下来,技术稳定下来。”
“如果(现在)机器人零件,比如头都掉了,还在跑,证明还不是真正的具身智能,但我相信,到明年的马拉松赛事,机器人就可以自己跑了,不需要人在后面遥控了。”
以下是张正友采访实录,经过不改原意的删改:
Q:早上演讲时您最后提到,唐代智通大师留下的四句偈语:“三身元我体,四智本心明。身智融无碍,应物任随形。” 2021年时,您说过说要翻译道德经,后来有翻译吗?像这种东方的哲学,对于机器人理念的设计上会有一些启发吗?
张正友:肯定会有启发的。演讲时我用了唐朝傅聪大师的一句话,身智融无碍,对吧。现在可能我们经常会看到有些演示,比方说,跑步的时候头掉了,这机器人还在跑,或者是手臂断了,还上去抓这个东西——你可以很明显感觉到,这不是具身智能。连自己自身的状态都没有感知的话,这机器人与我们想要的差很远的。身体跟智能要紧密结合,要和谐融合都是很重要的工作。
以前我提过,虚拟世界和真实世界要无缝的紧密结合,这个观点也有一点融合东方的思想。放在机器人,我们通过仿真训练就知道,到底执行会不会比较完善。如果想象出来和真实执行差的比较远,那么就要修正自己的规划。
《道德经》我翻译第四遍了,每翻译一遍重新看一遍,都有不同的启发。但我的目的不是为了出书,是为了提供自己不断提升的过程。
Q:今天看Tairos 发布,想到曾经其他大厂也做过类似的平台,想去支持车企,但最后在业界并没有那么成功,那现在腾讯做开放平台成功的可能性变大了吗,有什么地方不一样?
张正友:你这个担忧非常真实。往好的方向想就像Windows——它要涉及很多不同厂家的PC机,如果没有很好的兼容,到最后是不可能发展起来的。
我们从一开始就让开发平台跟好几家机器人客户厂家整体打磨,不是发布完就不管。今天你看到的小五机器人、越疆、帕西尼都搭载了平台。
Q:腾讯在具身智能大模型和云服务业务上相比其他平台的优势是什么?
张正友:一个是模块化,厂家可以选取他想要的模块。比如,感受模块,假如他自己的感知能力很强,就不需要我们这个模块;另一个是我们平台完整,包括左脑右脑小脑,同时允许接入第三方模型。但是这个模型需要经过具身智能特训——我们有套流程:从开源基础模型加上我们自己具身数据预训练的模型,厂家只需要用自己的东西少量数据就能快速适配,整个流程非常顺。
Q:腾讯说不做硬件,要做厂商的合作伙伴,最近收到合作伙伴主要需求是什么?现阶段,精力和资源会着重放在哪些能力提升上?
张正友:我们跑过全国北京、上海、深圳、成都等六十几家企业,发现中国大量机器人企业,硬件做得很好。腾讯在具身投入非常大,做了7年了,大家对我们做这个事是非常欢迎的。我们选高配合度种子企业深度打磨,7月平台标准化后开始铺量——这也是过往腾讯做产品的思路,一下子是不能铺太多的。
腾讯的重点优势就三个:模型能力(规划/感知/行动联合模型)、仿真环境、多模态感知。今天发布还是初版,后面随着更多企业参与,平台会打磨得更好。
Q:机器人落地目前最急需补足的技术是什么?
张正友:核心是对三维世界的可操作认知。现在很多“世界模型”建个咖啡杯3D模型,你可以在里面动来动去看起来很漂亮——但机器人是需要真实把它抓起来。他们建的模型是全部连在一起的,这和我们需要的可操作模型有根本区别。
规划方面,大语言模型是通过文本理解世界,但很多文字是描述不清楚的。动物没文字语言也能在3D世界活下来,证明非语言认知很重要。
触觉传感器从成立之初我们研究了7年,现在还没达到真正标准化。
Q:腾讯 Robotics X 实验室的商业化目标此前比较谨慎,之后态度会不会有所改变?
张正友:我们7年前成立时,就没有任何商业化路径。当时必须从头做,既做硬件又做软件,从2023年下半年开始,行业就有很大变化,很多机器人厂商出现。
现在形势已经变化了。腾讯需要跟机器人硬件本体厂家一起,把具身智能技术,跟本体厂家一起去打磨,否则就是停留实验室前沿探索。当然探索还会继续,但有些能力希望跟本体厂家一起去打磨技术。
与其说商业化,其实更乐于提产品化。商业化听起来是,要赚钱。我们不是以赚钱为目的的。我们希望变成一个比较稳定的产品,来赋能机器人行业。
Q:既然要做机器人厂商的合作伙伴,腾讯之后是不是不会再做机器人产品了?
张正友:我们从来不做产品,都是研究原型。“小五”也不是产品。
最早我们的机器人其实是更先进的,腿轮一体的探索移动形态创新——为什么非要用腿?平地上轮子效率高得多。后面做的调酒机器人,是验证触觉技术,养老机器人研发人机交互安全性。这些原型验证完技术我们就继续推进前沿,不会停在产品化和商业化。
现在Tairos 平台发布后,还会继续做一些反思性的研究性的硬件——因为硬件软件完全脱节效果不好。
Q:你们选择做什么,不做什么,决策逻辑是怎么样的?
张正友:从我个人角度,还有更大目标在支撑着。为了实现未来的养老场景,我们要继续推进机器人的智能和本体里的核心技术,比如初级测量器定制皮肤这些能力。
我加入腾讯的时候,规划的是十年。现在已经7年了,也许差不多3年后,就能实现。假如我一开始就只潜心在机器狗上,后面就没精力研究其他了。既定目标是很宏伟的,要沿着这个目标继续前行。
Q:从时间轴上,现在具身智能处在哪个阶段?
张正友:这是一个探索的过程。比方说,以前BlackBerry(黑莓手机)是失败了,但是没有那个过程,后面怎么会出现像iPhone这些设计出来?对于我来讲,本体的探索是需要要投入进去,必须要投入进去。
Q:怎么评价当下火热的机器人赛事?
张正友:赛事还是一个很重要的推动力,能够推动技术往前。就像大模型,大家都可以去尝试。
但比如说,现在一些机器人脑袋掉了还得跑,说明这个技术是没用的,它没有感知能力,对吧?你就不会去关注某个厂家,仅仅是为了比赛而赛。从我们真正的技术研究角度和行业发展角度讲,还是希望这些比赛提升整个具身赛道真正的能力,还是有帮助,但我们自己可能不太会参加。
现在马拉松,我们看到的是人在后面遥控,因为感知模型不够,只是这个技术还没到时候。我相信可能明年就能做到了,机器人能自主跑起来。
Q:为什么不做双足机器人?
张正友:我不是对双足机器人有什么“仇恨”。双足人行这个形态已经在那里了,你不需要花更大精力去思考,只是去控制它就行了,这是其中一个思路。另外一个思路就是有好几个可能性。
双足,是人在几千万年进化过程中,为了适应复杂环境进化出来的。但现在是人居环境,实际上双足效率很低。我们想探索的,既有轮子又有腿,想看看有没有更好的形态,适合人居环境。
假如我们人形机器人行作为标准,这其实是限制了我们对机器人的想象力。比如说,人不能进化出屏幕,但技术可以。如果仅用自然语言交互,会被速度限制。
假如机器人是一个屏幕,信息呈现在屏幕上,人类读取信息的效率提升了三倍。那为什么一定要用语言去对话呢?
我不是简单否认双足形态,而是有很多其他形态可以去探索。
Q:成立7年,中间应该也有过一些阶段性成果,现在这个时间点,是怎么判断可以商业化了?
张正友:现在这个时间点跟行业发展有关系。上一个阶段,大家都还是在做工业机器人。2023年开始,具身智能火热,大量本体公司出现,能用上。更多是来自市场和产品的需求。
我们也不会放弃前沿技术,假如如果探索停半年,也许感知模型、规划模型就落后了。现在前进的大方向,跟我七年前的判断,几乎是没有变化的。
当初也没想那么多,只是在考虑研究前沿技术。研究人员不能被产品化引导,技术是不能被产品化引导的。7年前,如果马化腾先生让我来成立机器人实验室,马上做个产品,我就不会来了。
今天上台签约的厂商,很多也不是腾讯投资的,我们是要支持整个机器人行业发展。目前机器人行业离iPhone时刻还有很大的距离。怎么让整个生态起来,是最重要的问题。
Q:您刚才提到,腾讯对实验室的耐心还很多,但我们看到前两年各大厂都在做AI lab,都陆续做不下去,你们会有担忧吗?怎么看当下一些人才的流失情况?
张正友:外面的吸引力很大,好处是仍然有很多同学留下来,更多新鲜企业补充进来。我们跟初创公司不太一样,支持力度对年轻研究人员很大,希望深度探索。这个环境是很难得。
现在大部分做数据采集,做科研,做导览。利用这个平台,助力行业进入大哥大时代。应该是养老场景比较适合的。也有人认为是工业场景。不管是哪儿,场景要足够大。
Q:做得早,或者做得晚都不一定是成功的,你们在具身智能中的节奏和战略是什么样的?
张正友:我之前做机器狗不是为了做机器狗,是为了长远的理念,为了运动能力。不一定做足式或者轮式,我们是想探索新的方案,足式轮式一体化,是很大的创新。
腿和人结合,应用到机器人小五上。走楼梯,是足式。平地是人式的。我们要跳出一般的平常人的思考方式,去想有没有更合理高效的一个技术方向。
我们做得很早,现在有些能力能够支持行业发展,所以就开放出来,但现在还是初级阶段,还有很长的路要走。
Q:怎么看待行业过热的情况?
张正友:从技术角度讲,更多的企业和研究单位参与进来,这都是好事情。行业就发展的会越来越快。但假如说,是不是有些企业会技术不够成熟,到最后倒闭了,任何一个技术在发展过程中都有这个可能。