在人工智能与机器人技术迅猛发展的当下,行业对AI大模型的期待与现实应用之间的落差引发了广泛讨论。宇树科技创始人王兴兴在近期一场科技论坛上直言,当前机器人领域的核心瓶颈并非硬件,而是AI大模型的能力尚未达到实际需求,尤其在多模态交互与复杂任务执行层面仍存在显著短板。
王兴兴指出,尽管机器人硬件技术已足够成熟,甚至“未来一两年内无需重大升级”,但AI模型的局限性导致硬件潜力难以充分释放。例如,在控制机器人灵巧手完成精细操作时,现有模型仍无法实现语言指令与动作的精准匹配;在家庭服务场景中,机器人对“寻找昨天收到的快递”这类模糊指令的处理能力也远未达标。这类任务需要模型同时理解时间、空间、物体属性等多维度信息,并具备跨模态推理能力,而当前模型仍依赖大量标注数据和预设规则,难以应对真实世界的复杂性。
这一观点并非孤例。网络上曾流传一个调侃:“我们期待AI帮忙洗碗,自己专注艺术创作;结果却是AI在创作,而我们还在洗碗。”这一矛盾折射出公众对AI技术落地的迫切需求与现实能力之间的差距。王兴兴认为,AI时代为年轻人提供了公平的机遇,但前提是突破现有模型的工具化局限,将其视为“全能型伙伴”而非简单工具。
从技术层面看,大模型的发展仍处于初级阶段。尽管参数规模持续膨胀,但多数模型仍依赖统计规律进行模式匹配,缺乏对事物本质的理解。例如,在自然语言处理中,模型可能准确回答标准问题,却难以捕捉隐喻、双关语或文化背景的深层含义;在图像识别领域,对罕见物体或特殊场景的识别仍需大量训练数据。这种“浅层智能”导致模型在面对动态环境或跨领域任务时表现乏力。
机器人领域的挑战尤为突出。具身智能(Embodied AI)要求模型不仅处理信息,还需通过身体感知环境并自主决策。然而,当前模型与人类思维的差异显著:人类能凭借直觉和经验快速判断,而模型需通过海量数据训练才能完成简单任务。例如,家庭机器人虽能执行“播放音乐”等指令,却难以理解“根据家人喜好调整房间布置”这类涉及情感与常识的需求。这种差距使得机器人仍停留在“工具化”阶段,远未达到“智能体”水平。
行业普遍认为,单纯扩大模型参数已非最优路径。高参数模型虽能提升性能,但伴随训练成本激增、推理速度下降等问题。更关键的是,参数规模与实际应用能力并非线性相关。例如,某些模型在特定任务中表现优异,却无法迁移至其他场景。因此,优化训练算法、提升数据效率、加强模型与硬件的协同,成为突破瓶颈的关键。
王兴兴强调,AI的进化需聚焦具身智能的落地。这要求模型从“被动响应”转向“主动感知”,通过实时环境反馈动态调整策略。例如,服务机器人在清扫时需识别障碍物类型,判断是否需要移动;工业机器人在装配时需根据零件变形调整力度。这些能力依赖模型对物理世界的深度理解,而当前技术仍无法满足需求。
尽管挑战重重,但行业对AI的潜力仍持乐观态度。王兴兴鼓励年轻人积极拥抱AI,将其作为重新定义职业路径的契机。他预言,随着模型与硬件的深度融合,机器人将逐步从“执行者”转变为“协作者”,真正融入人类生活。而这一目标的实现,仍需跨学科协作与持续技术创新。