机器人何时学会摸、闻、尝？突破AI感知盲区，顶尖实验室正唤醒“沉默感官”

IP属地中国·北京 文汇报 时间：2026-06-11 08:39:17

相信你一定有这样的生活经验：网购一件毛衣时，图片再清晰，也很难让你判断出它穿上身是否扎人、闷热；冰箱里的牛奶有没有变质，不能光看印在包装上的生产日期和保质期，有时鼻子一闻就会有答案。
这些再普通不过的生活经验，恰恰暴露了当下人工智能（AI）的短板。过去几年，AI变得越来越会看、会听、会说，能识别图片、理解语音、生成文字，可一旦走出屏幕，进入厨房、病房、工厂、农田，它就会遇到更真实而复杂的问题：杯子要用多大力才能拿稳？草莓熟到什么程度才适合采摘？老人摔倒前身体重心有什么变化？食品是否已经开始腐败？仅靠摄像头和麦克风，AI并不能进行完整的判断——除了看见颜色、听见声音，它还要能摸到纹理（触觉）、闻到气味（嗅觉）、分辨味道（味觉）。长期以来，触觉、嗅觉与味觉被称为“沉默感官”，尽管它们同样是人类感知世界的重要组成部分，却经常被忽视。因为，与视觉可捕捉光影、听觉可捕捉声波不同，这三种感官的物理信号具有难以捕捉、缺乏统一标准等特点：触觉是复杂机械力的反馈，气味由多种化学分子混合构成，味觉则依赖多种味觉受体的协同作用。于是，多感官智能被推到了AI发展的前台，它试图让机器拥有更接近人类的感知能力。在全球多家顶尖科研机构的持续努力下，一场全感官数字化探索已然开启，AI正逐步突破视听领域的局限，向具备全感官感知能力的智能系统发展，重新构建人类与数字世界、物理世界的连接模式。唤醒沉默感官突破AI感知盲区人类认识世界，从来不是靠单一感官完成的。人们在买桃子时，不只看果实色泽，还会凑近闻一闻、用手按一按——成熟的桃子往往带着淡淡果香，手指按上去能感到果肉柔软却不塌陷。由此可见，人类高效认知世界的核心在于多感官的协同作用、多维度感知信息的融合，这样才能快速、全面地掌握事物属性。当我们看到一杯热茶冒着白气，会自然想到杯壁可能烫手；闻到厨房里一丝焦味，会立刻想到可能锅烧糊了；拿起一枚鸡蛋时，我们的手指会自动调整力度，既不让它滑落，也不把它捏碎。这些判断看似轻松，背后全是视觉、嗅觉、触觉和经验的快速配合。ChatGPT的文本生成能力、AlphaGo的棋艺水平，充分体现了AI在抽象计算领域的卓越成就。但在充满了柔软、滑腻、潮湿、弹性、温度和气味的真实世界中，传统AI暴露出自己的局限性——感知维度缺失。由于无法获取物体的触感、气味等关键信息，机器人难以完成精准抓取、食物新鲜度判断等基础任务。这正是莫拉维克悖论的具体体现——计算机易于实现逻辑推理等高级智慧，却难以复刻人类的感知、运动等基础能力。正如“人工智能之父”图灵在1950年《计算机器与智能》中所预见的，AI的发展不应局限于逻辑推理等高级智慧层面，还应具备类似人类的感知能力——通过多感官与世界交互，积累认知经验。这也是当前具身智能的核心发展方向，而多感官智能正是这一方向的关键突破点。机器人要打扫房间、护理老人、完成装配、参与救援，就必须知道物体能不能碰、该怎么碰、碰到什么程度才安全。多感官智能正是具身智能走向现实的一块关键拼图。它的意义不只是让机器人更灵巧，也让AI更有分寸。技术发展到这一步，机器不再只是执行命令，更要学会理解环境。多感官智能的出现，旨在使AI具备类似人类五官的感知能力，实现对物理世界更全面、细腻的认知。它重点推进触觉、嗅觉、味觉等感官的数字化，将难以捕捉的感官信号转化为机器可解读、处理与模拟的数字符号。这一探索不仅是AI领域重要的技术突破，更是人类推动机器实现物理世界共情的重要尝试，能使AI与人类的交互从指令响应升级为更具实用性的感官协同。与传统AI相比，多感官智能并非孤立传感器的简单叠加，而是要构建一个统一的物理世界感知基座，能将触觉、嗅觉、味觉信号，与视觉、听觉信号融合，形成更完整的世界认知体系，作出更精准、更贴合人类认知习惯的判断，提升技术的实际应用价值。跨模态对齐让AI学会“闻、尝、摸”其实，早在100多年前，人们就开始了多感官智能的探索。在这些年的发展过程中，科学家重点解决了感官信号的捕捉问题，而当前科研工作的核心则是实现AI对感官信号的理解与应用。多感官合在一起，AI才会真正靠近人。不过，真正的多感官智能并不只是多装几个传感器，而是让AI把不同感官的信息联系起来，共同构成判断。这正是当前多感官智能研究的重点，对具身智能尤其重要。未来的机器人不可能每一步都等人发指令，它要自己判断草莓能不能摘、老人要不要扶、零件是否安装到位、机器是否出现异常。只有把视觉、听觉、触觉、嗅觉等信息综合起来，它才可能在真实环境中作出稳妥反应。根据麻省理工学院（MIT）多感官智能实验室的研究理念，多感官智能不是孤立传感器的叠加，而是统一的物理世界感知基座，跨模态对齐则是现阶段的核心技术突破点。跨模态对齐的核心是实现AI对不同感官信号的关联分析，即让AI能够通过一种感官信号，推断其他相关感官信息。就像人看到面包出炉，会想到它可能外脆里软一样，通过这项技术，AI能将单一感官信号转化为全面的认知信息，提升判断的精准度与贴合度，增强技术的实用性。MIT最新的机器人实验，充分体现了跨模态对齐技术的优势。研究人员让AI观察揉捏橡皮泥的视频，AI通过分析橡皮泥的形变、颜色变化，可精准推断橡皮泥的触感强度、人类揉捏橡皮泥的力度，从而使机器人摆脱生硬的操作模式，提升人机协同的流畅性。除了触觉与视觉的协同应用，嗅觉与味觉的AI化技术也正从实验室逐渐走向实际应用。当前的AI模型已经能够捕捉人类呼出气体中的挥发性有机化合物，这类化合物的种类、浓度与肺癌、帕金森病等疾病密切相关。二十年前，此类检测需依赖昂贵的质谱仪且耗时数周；如今，集成多感官智能芯片的移动设备可实现快速、精准检测，为疾病早期筛查提供技术支撑。未来，AI的发展方向将是具备全感官感知能力的综合模型，能够融合所有感官信号，实现对物理世界全面、立体的认知。目前，MIT多感官智能实验室正在致力于研发全感官大模型，旨在复刻人类多感官协同、多维度信号融合的认知模式，使AI能在与物理世界的交互中不断学习优化，对事物形成更完整的认知，实现更自然、更智能的人机协同。比如，利用柔性印刷电路板技术，科学家正在开发柔性触觉皮肤的自动化设计技术，它能为普通物体赋予高灵敏度的触觉感知功能，未来可应用于可穿戴设备、远程医疗等领域。再如，AI辅助嗅觉与味觉创造技术，可以利用生成式AI开发全新的香水配方、食物风味，为美妆、食品行业提供创新支撑；而健康与社会化AI，则通过捕捉人类生理信号，实现对疲劳、压力及病理状态的识别，为心理健康、精准医疗提供技术支持。多感官智能重塑文明发展智能图景随着多感官智能技术的成熟，它将逐步从实验室走向大众生活，渗透到医疗、电商、元宇宙等多个领域，对人类的生活和工作产生深刻影响，推动人类文明向更智能的方向发展。在远程医疗领域，多感官智能技术将打破隔空诊疗的局限。现在，医生通过视频看诊，仅能观察患者外在症状，难以作出精准判断。未来，医生借助触觉反馈手套，可远程感知患者身体肿块的硬度、大小等，通过数字化味觉传感器分析患者代谢物，从而更精准地判断身体状态。这一技术不仅能提升远程诊疗质量，还将推动优质医疗资源向偏远地区延伸。比如，在远程手术中，柔性触觉设备可帮助医生精准感知组织硬度，降低操作失误风险。在电子商务领域，新技术将把购物体验从“所见即所得”，升级到全感官体验，解决当下网购感知缺失的痛点。未来，超声波波束成形技术可模拟材料触感，让消费者在网购衣物时，感知面料质感；味觉、嗅觉模拟器则能让消费者网购美食时“云试吃”，提前感知食物味道与香气。在元宇宙与数字孪生领域，人们有望实现真正的沉浸式体验。当前元宇宙主要聚焦于视觉与听觉，缺乏触觉、嗅觉、味觉的支撑，很难实现真正的身临其境。多感官智能技术的加入，将使虚拟场景具备更全面的感官体验，进一步模糊数字世界与物理世界的边界，改变人类的娱乐、社交方式。此外，多感官智能技术还将在农业、食品、工业等领域发挥重要作用：农业领域可借助嗅觉感知农作物生长状态与病虫害的发生，食品行业可快速检测食品新鲜度与有害物质，工业领域可借助机器人完成更精细的组装、检测任务，提升生产效率与产品质量。多感官智能百年探索史嗅觉 >>>
1906年，美国宾夕法尼亚州一家影院为增强观影沉浸感，通过风扇向观众席吹送玫瑰精油的气味。这是人类首次将嗅觉体验引入媒体传播领域，标志着嗅觉数字化探索的开端。
20世纪60年代，一种新的气味电影技术问世。该技术在影院座椅下方铺设管道系统，可根据剧情同步释放对应气味，但最终由于成本高昂、气味残留等问题未能商业化。
1999年，硅谷一家初创公司推出了一种内置64种基础气味“墨盒”的数字化气味设备，能合成多种气味，并配合网页、视频同步释放。该设备曾广受关注并获巨额融资，但受限于当时的技术水平，最终未能实现市场化应用。
2019年，嗅觉AI迎来历史性突破。谷歌与Osmo公司利用图神经网络，对5000种分子结构进行深入分析，构建起人类主嗅觉图谱，实现了仅凭分子结构即可精准预判气味的功能，使嗅觉数字化从盲目模拟升级到可精准预判。
触觉 >>>
20世纪40年代，为安全处理放射性物质，美国阿贡国家实验室的科学家雷蒙德·戈尔茨研发出早期遥操作机械臂，触觉反馈技术随之萌芽。其核心目的是让操作人员感知机械臂与物体的接触力度，避免损坏物体与操作安全隐患。
然而，由于传统压力传感器阵列分辨率较低，无法识别物体表面的细微纹理，导致机器人难以获得精准的触觉感知，只能完成简单抓取动作。
2009年，麻省理工学院的一个研究团队研发出GelSight技术，摒弃传统压力传感器思路，采用光学成像原理捕捉微观触觉信号，可实现微米级立体几何形状还原，清晰呈现物体表面纹理。该技术使机器获得了超越人类手指的触觉感知精度，使机器人能够完成分拣、组装等精细操作，为工业机器人、服务机器人的发展提供了核心技术支撑。
味觉 >>>
味觉数字化难度最高、起步最晚。这是因为味觉感知过程复杂，不仅与食物化学成分相关，还受个人生理差异、情绪状态等因素影响，精准复刻味觉体验的技术挑战远超嗅觉与触觉数字化。
2012年，新加坡国立大学研制出“数字棒棒糖”，这是人类首次通过数字技术模拟出味觉。该设备通过电流刺激舌尖味觉受体，可模拟酸、甜、苦、咸四种基础味觉，虽然模拟效果较为粗糙，但为味觉数字化探索提供了新思路。
近几年，日本明治大学研发出“海苔卷合成器”，借鉴彩色打印机三基色原理，内置五种电解质凝胶，分别对应甜、酸、咸、苦、鲜五种基础味觉，通过调节电流强度实现多种复杂味觉的合成。该技术有望应用于游戏、美食、医疗等领域，实现虚拟味觉体验、味觉障碍辅助治疗等功能。
技术越贴身，越要讲分寸
百年来，人类一直在尝试通过技术再现感觉。如果说过去的AI只是拥有眼睛和耳朵，那么未来的AI则将慢慢长出手指、鼻子和舌头。当机器开始理解什么是柔软、清香、酸甜、粗糙和温热，它才能真正摆脱屏幕，走进生活现场。

MIT最新机器人实验让AI学习橡皮泥的触感
然而，技术越贴身，越深入地介入人的感受，就越需要被谨慎对待。触觉、嗅觉、味觉数据看似平常，背后可能包含了人的健康状态、生活习惯、情绪变化等隐私信息。如果被过度采集或滥用，其风险或与人脸、指纹和语音信息泄露相当。因此，未来多感官智能技术若要进入家庭、医院和公共空间，必须同步建立相应的标准，确立伦理规范和隐私保护机制。
必须牢记的是，机器哪怕拥有五感，也不意味着它能完全替代人的感受，更不应取代人去感受世界。因此，相关技术更理想的发展方向，是去弥补人类看不见、够不着、感觉不到，包括来不及判断的部分，比如协助医生更早发现疾病，降低安全生产风险，让老人活得更有尊严等等。
目前，多感官智能的发展仍处于初级阶段，未来的探索之路还很漫长。这场全感官数字化探索，不仅是AI的技术突破，更是人类认知世界方式的革命性延伸，将推动人机协同向更智能、更高效的方向演进，为人类文明发展注入新的动力。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

我国首个光计算产研融合平台在上海启动，交大与曦智科技共建实验室

美股收盘：三大指数集体下跌，纳指跌近2%；芯片股全线下挫，高通跌近7%；国际金价跌穿4100美元

机器人何时学会摸、闻、尝？突破AI感知盲区，顶尖实验室正唤醒“沉默感官”

美国推“创世纪”，上海抢先落地“百团百项”：技术顶格科学家回炉补商业课

SpaceX即将上市，与“客户A”深度绑定

Anthropic首席执行官：政府有权叫停存在风险的人工智能

全站最新

我国首个光计算产研融合平台在上海启动，交大与曦智科技共建实验室

美股收盘：三大指数集体下跌，纳指跌近2%；芯片股全线下挫，高通跌近7%；国际金价跌穿4100美元

机器人何时学会摸、闻、尝？突破AI感知盲区，顶尖实验室正唤醒“沉默感官”

美国推“创世纪”，上海抢先落地“百团百项”：技术顶格科学家回炉补商业课

热门推荐

大疆Pocket 4P于6月15日发布，起售价3799元

华纳音乐集团收购AI技术公司Sureel

我国首个光计算产研融合平台在上海启动，交大与曦智科技共建实验室

OpenAI携手Visa(V.US)推出AI代理支付功能 ChatGPT可自动完成购物和付款

美股收盘：三大指数集体下跌，纳指跌近2%；芯片股全线下挫，高通跌近7%；国际金价跌穿4100美元

机器人何时学会摸、闻、尝？突破AI感知盲区，顶尖实验室正唤醒“沉默感官”

美国推“创世纪”，上海抢先落地“百团百项”：技术顶格科学家回炉补商业课

外媒：美AI数据中心扎堆，旱上加旱

5月新能源汽车产销量同比两位数增长

SpaceX即将上市，与“客户A”深度绑定

Anthropic首席执行官：政府有权叫停存在风险的人工智能

AI冲击就业前景引发广泛讨论，专家热议“谁将真正受益于人机混合劳动力时代”？

谷歌推出DiffusionGemma文本扩散模型：本地AI推理速度提升4倍

警惕“无感”泄密！这几个场景要注意

最新自然指数：全球十强机构，中国占据九席！浙大超越哈佛跃居世界第二