具身智能与大模型的融合再进一步。智元机器人近日宣布与MiniMax(上海稀宇科技)达成战略合作,MiniMax将为智元人形机器人提供端到端的文本到语音(TTS),显著提升机器人在真实场景中的自然交互能力与情感表达水平。
全链路语音赋能,打造“会说话”的智能体
此次合作聚焦语音合成核心技术,MiniMax将其在高自然度语音生成、多情感语调建模、低延迟实时推理等方面的领先能力,深度集成至智元机器人系统。这意味着智元人形机器人将能:
- 以接近真人的流畅语调进行对话;
- 根据上下文自动切换喜悦、关切、郑重等情感语气;
- 在复杂噪声环境下实现低延迟、高清晰度语音输出,保障人机沟通效率。
该技术将率先应用于智元在家庭服务、商业导览、医疗陪护等场景的机器人产品中,使AI不仅“看得见、做得对”,更能“说得准、讲得暖”。
强强联合:大模型公司×具身智能先锋
MiniMax作为国内大模型第一梯队代表,其MoE架构大模型与端侧推理优化能力已广泛应用于手机、汽车、IoT设备;智元机器人则在人形机器人本体控制、运动规划与场景落地方面快速突破。此次合作,标志着“大脑”(大模型) 正加速融合。
行业分析指出,语音交互是人形机器人走向实用化的关键一环。当机器人能以自然、有温度的声音与人交流,用户接受度与信任感将大幅提升,为规模化商用铺平道路。
AIbase观察:语音不再是“附属功能”,而是具身智能的“灵魂接口”
在当前人形机器人竞赛中,多数厂商聚焦于行走、抓取等物理能力,而智元与MiniMax的合作,凸显了对交互体验的重视。未来,真正能走进家庭与公共场所的机器人,或许不是跑得最快的,而是最会“说话”、最懂人心的。
随着大模型厂商从“云端”走向“端侧”,与硬件厂商共建“感知—决策—执行—表达”全栈智能体,中国具身智能生态正加速走向成熟。而这场由语音开启的温情革命,或将成为人形机器人破圈的关键。





京公网安备 11011402013531号