当前位置: 首页 » 资讯 » 科技头条 » 正文

我们采访了春晚秀武术的宇树机器人,发现它还挺有人味儿的…

IP属地 中国·北京 编辑:周伟 差评 时间:2026-02-17 12:10:59

跑酷、跳马、后空翻、双截棍、醉拳。。。如果只看这几个关键词,你八成以为这是哪家武术学校的招生简章。

但这回,差评君说的是春晚节目《 武 BOT 》。

几十个机器人依次排开,动作连贯、节奏紧凑,上台就是一套零帧起手的丝滑连招。

弹幕一开,惊起 6 声一片。

微博这边更是直接炸锅,评论区盖了几百层楼,大伙儿纷纷表示:震惊,再看亿遍。

连见多识广的编辑部,都忍不住倒吸一口凉气。

说实话,对比去年的原地站桩,今年春晚的宇树机器人连翻带打、招招到位,不说和人一模一样,这简直是在超越人类的边缘反复试探。。。

那么问题来了,机器人到底是怎么做出这么炫酷的动作的?机器人,是怎么做到这么有人味儿的?

这回,差评君提前潜入春晚排练间,采访到了这次登台的宇树 G1 机器人 —— 笨笨,听它给各位差友讲讲幕后的故事。

刚溜进屋,差评君一眼锁定全场目光的焦点。笨笨上来就是狠活儿,原地空翻 high 到不行。

紧跟着又是一段关节丝滑,身体摇摆起伏控制恰到好处的螳螂拳:

最后一套武术连招收尾,铁甲钢拳一身蛮力,这压迫感各位差友感受一下:

但走下舞台的笨笨,也只是普通 “ 人 ” 罢了。

要在镜头聚焦下做到万无一失,背后还有更多无人知晓的艰辛。

在排练间脱下外套,它的身上满是练习留下的伤痕。好在越努力越幸运,这句话对硅基打工人同样适用。

想必大伙儿看得出,今年春晚的表演难度极高。如果说去年机器人还只会站桩模仿人类,今年的机器人,已经在超越人类的路上了。

即使动作从去年的站桩输出,变成了今年的高难特技,宇树科技 CMO 王其鑫在采访中表示,笨笨和兄弟们在春晚大规模彩排里,次次成功零翻车。

而在完美演出的背后,是一整套技术预案在疯狂兜底。

小到不起眼的舞鞋,都是实打实的工程装备。为了不把春晚的玻璃舞台踩出心理阴影,这双鞋既要能吸收冲击,又要保证落地稳定,胶水材料都要精挑细选。

大到机器人的控制算法,也做了一波大优化。

以前大家总觉得机器人不太聪明,但实际上,今年春晚台上每个动作的成功,都是它们自己听音乐、看舞台、理解环境,最后实时驯服四肢的结果。

也就是说,腿要抬多高,下一步队形往哪走,都要机器人自己来观察调整。而这种感知、决策、行动的闭环,一直是具身智能的长期难点之一。

说实话,刚开始差评君也以为这就是全部了。直到我们把机器人演员笨笨抓来唠两句,才发现春晚台前这些 “ 武将 ” 背后居然还有没见过的文戏,而且开口就是高情商。。。

这背后,是宇树和火山引擎一起调教的语音对话能力,在智力、眼力和嘴皮子上都下了不少功夫。

比如我们问起它和成龙谁更厉害,笨笨立刻谦虚起来了:

自动播放

这回答和笑声一搭配,求生欲拉满:

自动播放

不知道各位差友是啥感觉,反正差评君觉得,会说话的笨笨不再像个冰冷的跳舞机,多少带点感情。

我们能明显感觉出,笨笨不止声线和真人差不多,对不同的内容,它的情绪表达是不一样的。好事语调高,语速快;坏事语调低,心情低落。

深入问了火山引擎的技术团队,笨笨说话的背后,全靠豆包语音合成模型在发力。

机器人每一句输出前,模型都要先理解上下文的语义和情绪,再决定表达方式。语速是急是缓,语调是高是低,甚至停顿的位置、情感参数都在动态生成。这也是为什么它听起来没有棒读感,更像人一样在说话。

声线也不是随便生成,而是专门按宇树 G1 的气质捏出来的,主打一个青春男大。

不过,光有感情还不够,真正让笨笨开窍的,是豆包大语言模型。

不只语音识别精准,你让它整段春节祝词,十秒钟不到,吉祥话直接批发式输出:

自动播放

代表机器人群体的发言也是滴水不漏:

自动播放

笨笨还向差评君透露,豆包大模型的视觉理解能力,甚至能让机器人看懂世界。

之前邪恶豆包的穿搭指导不知道各位差友刷到没,蓝高跟配红丝袜,直男推荐荷叶边,短裙当披肩。。。开了眼的豆包没干啥好事,纯纯报复人类。

好在笨笨挺老实,让它评价一下过年走亲戚的穿搭,不是瞎夸,它真能看懂你身上穿了啥,再把情绪价值直接给足:

自动播放

但大家对机器人和大模型的结合,显然不止这些期待。差评君采访了火山引擎的幕后团队,“ 一方面是想让机器人更有情绪,能聊天陪伴;但更重要的,是验证一套更通用的能力 —— 让机器听懂人话,再把理解变成行动。”

当然,这话有点儿玄。差评君当场发问:现在看起来,不就是用嘴下个命令嘛?

这下技术人员坐不住了,这事儿要做好,可比外行人看起来的复杂多了。

人轻飘飘一句 “ 你往前走一点 ”,可 “ 前 ” 是相对谁的方向?“ 一点 ”是几厘米?这就是语音识别 + 大模型语义推理的第一关,把模糊的人话变成精确意图。

接下来,模型还得负责把指令翻译给机器人听,拆成细致的动作安排。腿先抬多少、身体往哪偏、脚什么时候落地,全都得精确计算。同时规划几十个关节,复杂的协同控制,是大模型的第二关。

虽然现在语音控制机器人能做的事还不是很多,也许只能给你一个拥抱。

自动播放

但这只是机器人听懂人话的第一步。说不定有一天,只要一声令下,承包家务、辅导作业、外出打工补贴家用都成机器人的标配,就跟现在打开手机让豆包监督小孩写作业、教穿搭一样轻松。

只不过,那时候的小孩哥搞不好已经学会反向攻略机器人,让硅基生命心甘情愿沦为作业代写了。。。

宇树科技 CMO 王其鑫在采访中也提到,这次和火山引擎的合作,提升了机器人交互的亲切感和生动性,本质上,是在补齐机器人和人沟通的那块短板。

但机器人真正的变化,其实不止停留在 “ 说话更像人 ”。从外到内,机器人正在开始像人一样学习。

通过强化学习和动作模仿,它们可以把人类的视频和行为拆解、吸收,再转化成自己的动作逻辑。换句话说,它不再只是按剧本执行预设程序,而是在理解环境、适应变化的过程中,自己长本事。这一步,是未来机器人进入现实复杂场景的技术基础。

短期内,机器人会优先进入商用与展示类场景;3 到 5 年,将在工业与高危环境大规模替代人工;而当可靠性与交互能力进一步成熟后,5 到 10 年内,人形机器人可能有机会真正走进家庭。

换句话说,我们今天在春晚看到的,正是它们能力验证的第一步。而未来机器人的目标,是逐步成为人类生产生活的长期搭档。

回看 2025 年,AI 和具身智能已经成了全民话题。即使你没有刻意关注,不可否认的是,我们每个人都在被科技的浪潮席卷向前。

而这一次,舞台同款能走能聊的宇树机器人,也通过春晚豆包 APP 抽奖互动送出了 25 台,就像一封投递向我们的未来请柬。

很多人担忧在飞速发展的时代里迷失,但差评君相信,科技发展的终点,是人类更美好的生活

过去,也许你经历过不少烦恼与困惑。那些无人倾诉的深夜,我们选择把问题交给了 AI。

而在未来,可能就像 Seedance 2.0 制作的春节宣传片一样,当我们拖着一年的疲惫推开家门,机器人早就把房间收拾妥当,做好饭菜。那些在琐事中消失的时间,终于可以还给身边更重要的人。

祝各位差友新春快乐。新的一年,希望技术继续进步,也希望它带来的,是实实在在的轻松。

愿未来的智能更贴近生活,你的日子也因此多一点从容。

标签: 机器人 豆包 宇树 模型 差友 语音 科技 引擎 情绪 舞台 动作 火山 关节 技术 环境 武术 作业 评君 琐事 求生欲 评价 实打实 十秒钟 开口 落地 小孩 语调 人类 丝滑 阴影 心理 身体

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。