![]()
相信你一定有这样的生活经验:网购一件毛衣时,图片再清晰,也很难让你判断出它穿上身是否扎人、闷热;冰箱里的牛奶有没有变质,不能光看印在包装上的生产日期和保质期,有时鼻子一闻就会有答案。
这些再普通不过的生活经验,恰恰暴露了当下人工智能(AI)的短板。过去几年,AI变得越来越会看、会听、会说,能识别图片、理解语音、生成文字,可一旦走出屏幕,进入厨房、病房、工厂、农田,它就会遇到更真实而复杂的问题:杯子要用多大力才能拿稳?草莓熟到什么程度才适合采摘?老人摔倒前身体重心有什么变化?食品是否已经开始腐败?仅靠摄像头和麦克风,AI并不能进行完整的判断——除了看见颜色、听见声音,它还要能摸到纹理(触觉)、闻到气味(嗅觉)、分辨味道(味觉)。长期以来,触觉、嗅觉与味觉被称为“沉默感官”,尽管它们同样是人类感知世界的重要组成部分,却经常被忽视。因为,与视觉可捕捉光影、听觉可捕捉声波不同,这三种感官的物理信号具有难以捕捉、缺乏统一标准等特点:触觉是复杂机械力的反馈,气味由多种化学分子混合构成,味觉则依赖多种味觉受体的协同作用。于是,多感官智能被推到了AI发展的前台,它试图让机器拥有更接近人类的感知能力。在全球多家顶尖科研机构的持续努力下,一场全感官数字化探索已然开启,AI正逐步突破视听领域的局限,向具备全感官感知能力的智能系统发展,重新构建人类与数字世界、物理世界的连接模式。唤醒沉默感官突破AI感知盲区人类认识世界,从来不是靠单一感官完成的。人们在买桃子时,不只看果实色泽,还会凑近闻一闻、用手按一按——成熟的桃子往往带着淡淡果香,手指按上去能感到果肉柔软却不塌陷。由此可见,人类高效认知世界的核心在于多感官的协同作用、多维度感知信息的融合,这样才能快速、全面地掌握事物属性。当我们看到一杯热茶冒着白气,会自然想到杯壁可能烫手;闻到厨房里一丝焦味,会立刻想到可能锅烧糊了;拿起一枚鸡蛋时,我们的手指会自动调整力度,既不让它滑落,也不把它捏碎。这些判断看似轻松,背后全是视觉、嗅觉、触觉和经验的快速配合。ChatGPT的文本生成能力、AlphaGo的棋艺水平,充分体现了AI在抽象计算领域的卓越成就。但在充满了柔软、滑腻、潮湿、弹性、温度和气味的真实世界中,传统AI暴露出自己的局限性——感知维度缺失。由于无法获取物体的触感、气味等关键信息,机器人难以完成精准抓取、食物新鲜度判断等基础任务。这正是莫拉维克悖论的具体体现——计算机易于实现逻辑推理等高级智慧,却难以复刻人类的感知、运动等基础能力。正如“人工智能之父”图灵在1950年《计算机器与智能》中所预见的,AI的发展不应局限于逻辑推理等高级智慧层面,还应具备类似人类的感知能力——通过多感官与世界交互,积累认知经验。这也是当前具身智能的核心发展方向,而多感官智能正是这一方向的关键突破点。机器人要打扫房间、护理老人、完成装配、参与救援,就必须知道物体能不能碰、该怎么碰、碰到什么程度才安全。多感官智能正是具身智能走向现实的一块关键拼图。它的意义不只是让机器人更灵巧,也让AI更有分寸。技术发展到这一步,机器不再只是执行命令,更要学会理解环境。多感官智能的出现,旨在使AI具备类似人类五官的感知能力,实现对物理世界更全面、细腻的认知。它重点推进触觉、嗅觉、味觉等感官的数字化,将难以捕捉的感官信号转化为机器可解读、处理与模拟的数字符号。这一探索不仅是AI领域重要的技术突破,更是人类推动机器实现物理世界共情的重要尝试,能使AI与人类的交互从指令响应升级为更具实用性的感官协同。与传统AI相比,多感官智能并非孤立传感器的简单叠加,而是要构建一个统一的物理世界感知基座,能将触觉、嗅觉、味觉信号,与视觉、听觉信号融合,形成更完整的世界认知体系,作出更精准、更贴合人类认知习惯的判断,提升技术的实际应用价值。跨模态对齐让AI学会“闻、尝、摸”其实,早在100多年前,人们就开始了多感官智能的探索。在这些年的发展过程中,科学家重点解决了感官信号的捕捉问题,而当前科研工作的核心则是实现AI对感官信号的理解与应用。多感官合在一起,AI才会真正靠近人。不过,真正的多感官智能并不只是多装几个传感器,而是让AI把不同感官的信息联系起来,共同构成判断。这正是当前多感官智能研究的重点,对具身智能尤其重要。未来的机器人不可能每一步都等人发指令,它要自己判断草莓能不能摘、老人要不要扶、零件是否安装到位、机器是否出现异常。只有把视觉、听觉、触觉、嗅觉等信息综合起来,它才可能在真实环境中作出稳妥反应。根据麻省理工学院(MIT)多感官智能实验室的研究理念,多感官智能不是孤立传感器的叠加,而是统一的物理世界感知基座,跨模态对齐则是现阶段的核心技术突破点。跨模态对齐的核心是实现AI对不同感官信号的关联分析,即让AI能够通过一种感官信号,推断其他相关感官信息。就像人看到面包出炉,会想到它可能外脆里软一样,通过这项技术,AI能将单一感官信号转化为全面的认知信息,提升判断的精准度与贴合度,增强技术的实用性。MIT最新的机器人实验,充分体现了跨模态对齐技术的优势。研究人员让AI观察揉捏橡皮泥的视频,AI通过分析橡皮泥的形变、颜色变化,可精准推断橡皮泥的触感强度、人类揉捏橡皮泥的力度,从而使机器人摆脱生硬的操作模式,提升人机协同的流畅性。除了触觉与视觉的协同应用,嗅觉与味觉的AI化技术也正从实验室逐渐走向实际应用。当前的AI模型已经能够捕捉人类呼出气体中的挥发性有机化合物,这类化合物的种类、浓度与肺癌、帕金森病等疾病密切相关。二十年前,此类检测需依赖昂贵的质谱仪且耗时数周;如今,集成多感官智能芯片的移动设备可实现快速、精准检测,为疾病早期筛查提供技术支撑。未来,AI的发展方向将是具备全感官感知能力的综合模型,能够融合所有感官信号,实现对物理世界全面、立体的认知。目前,MIT多感官智能实验室正在致力于研发全感官大模型,旨在复刻人类多感官协同、多维度信号融合的认知模式,使AI能在与物理世界的交互中不断学习优化,对事物形成更完整的认知,实现更自然、更智能的人机协同。比如,利用柔性印刷电路板技术,科学家正在开发柔性触觉皮肤的自动化设计技术,它能为普通物体赋予高灵敏度的触觉感知功能,未来可应用于可穿戴设备、远程医疗等领域。再如,AI辅助嗅觉与味觉创造技术,可以利用生成式AI开发全新的香水配方、食物风味,为美妆、食品行业提供创新支撑;而健康与社会化AI,则通过捕捉人类生理信号,实现对疲劳、压力及病理状态的识别,为心理健康、精准医疗提供技术支持。多感官智能重塑文明发展智能图景随着多感官智能技术的成熟,它将逐步从实验室走向大众生活,渗透到医疗、电商、元宇宙等多个领域,对人类的生活和工作产生深刻影响,推动人类文明向更智能的方向发展。在远程医疗领域,多感官智能技术将打破隔空诊疗的局限。现在,医生通过视频看诊,仅能观察患者外在症状,难以作出精准判断。未来,医生借助触觉反馈手套,可远程感知患者身体肿块的硬度、大小等,通过数字化味觉传感器分析患者代谢物,从而更精准地判断身体状态。这一技术不仅能提升远程诊疗质量,还将推动优质医疗资源向偏远地区延伸。比如,在远程手术中,柔性触觉设备可帮助医生精准感知组织硬度,降低操作失误风险。在电子商务领域,新技术将把购物体验从“所见即所得”,升级到全感官体验,解决当下网购感知缺失的痛点。未来,超声波波束成形技术可模拟材料触感,让消费者在网购衣物时,感知面料质感;味觉、嗅觉模拟器则能让消费者网购美食时“云试吃”,提前感知食物味道与香气。在元宇宙与数字孪生领域,人们有望实现真正的沉浸式体验。当前元宇宙主要聚焦于视觉与听觉,缺乏触觉、嗅觉、味觉的支撑,很难实现真正的身临其境。多感官智能技术的加入,将使虚拟场景具备更全面的感官体验,进一步模糊数字世界与物理世界的边界,改变人类的娱乐、社交方式。此外,多感官智能技术还将在农业、食品、工业等领域发挥重要作用:农业领域可借助嗅觉感知农作物生长状态与病虫害的发生,食品行业可快速检测食品新鲜度与有害物质,工业领域可借助机器人完成更精细的组装、检测任务,提升生产效率与产品质量。多感官智能百年探索史嗅觉 >>>
1906年,美国宾夕法尼亚州一家影院为增强观影沉浸感,通过风扇向观众席吹送玫瑰精油的气味。这是人类首次将嗅觉体验引入媒体传播领域,标志着嗅觉数字化探索的开端。
20世纪60年代,一种新的气味电影技术问世。该技术在影院座椅下方铺设管道系统,可根据剧情同步释放对应气味,但最终由于成本高昂、气味残留等问题未能商业化。
1999年,硅谷一家初创公司推出了一种内置64种基础气味“墨盒”的数字化气味设备,能合成多种气味,并配合网页、视频同步释放。该设备曾广受关注并获巨额融资,但受限于当时的技术水平,最终未能实现市场化应用。
2019年,嗅觉AI迎来历史性突破。谷歌与Osmo公司利用图神经网络,对5000种分子结构进行深入分析,构建起人类主嗅觉图谱,实现了仅凭分子结构即可精准预判气味的功能,使嗅觉数字化从盲目模拟升级到可精准预判。
触觉 >>>
20世纪40年代,为安全处理放射性物质,美国阿贡国家实验室的科学家雷蒙德·戈尔茨研发出早期遥操作机械臂,触觉反馈技术随之萌芽。其核心目的是让操作人员感知机械臂与物体的接触力度,避免损坏物体与操作安全隐患。
然而,由于传统压力传感器阵列分辨率较低,无法识别物体表面的细微纹理,导致机器人难以获得精准的触觉感知,只能完成简单抓取动作。
2009年,麻省理工学院的一个研究团队研发出GelSight技术,摒弃传统压力传感器思路,采用光学成像原理捕捉微观触觉信号,可实现微米级立体几何形状还原,清晰呈现物体表面纹理。该技术使机器获得了超越人类手指的触觉感知精度,使机器人能够完成分拣、组装等精细操作,为工业机器人、服务机器人的发展提供了核心技术支撑。
味觉 >>>
味觉数字化难度最高、起步最晚。这是因为味觉感知过程复杂,不仅与食物化学成分相关,还受个人生理差异、情绪状态等因素影响,精准复刻味觉体验的技术挑战远超嗅觉与触觉数字化。
2012年,新加坡国立大学研制出“数字棒棒糖”,这是人类首次通过数字技术模拟出味觉。该设备通过电流刺激舌尖味觉受体,可模拟酸、甜、苦、咸四种基础味觉,虽然模拟效果较为粗糙,但为味觉数字化探索提供了新思路。
近几年,日本明治大学研发出“海苔卷合成器”,借鉴彩色打印机三基色原理,内置五种电解质凝胶,分别对应甜、酸、咸、苦、鲜五种基础味觉,通过调节电流强度实现多种复杂味觉的合成。该技术有望应用于游戏、美食、医疗等领域,实现虚拟味觉体验、味觉障碍辅助治疗等功能。
技术越贴身,越要讲分寸
百年来,人类一直在尝试通过技术再现感觉。如果说过去的AI只是拥有眼睛和耳朵,那么未来的AI则将慢慢长出手指、鼻子和舌头。当机器开始理解什么是柔软、清香、酸甜、粗糙和温热,它才能真正摆脱屏幕,走进生活现场。
![]()
MIT最新机器人实验让AI学习橡皮泥的触感
然而,技术越贴身,越深入地介入人的感受,就越需要被谨慎对待。触觉、嗅觉、味觉数据看似平常,背后可能包含了人的健康状态、生活习惯、情绪变化等隐私信息。如果被过度采集或滥用,其风险或与人脸、指纹和语音信息泄露相当。因此,未来多感官智能技术若要进入家庭、医院和公共空间,必须同步建立相应的标准,确立伦理规范和隐私保护机制。
必须牢记的是,机器哪怕拥有五感,也不意味着它能完全替代人的感受,更不应取代人去感受世界。因此,相关技术更理想的发展方向,是去弥补人类看不见、够不着、感觉不到,包括来不及判断的部分,比如协助医生更早发现疾病,降低安全生产风险,让老人活得更有尊严等等。
目前,多感官智能的发展仍处于初级阶段,未来的探索之路还很漫长。这场全感官数字化探索,不仅是AI的技术突破,更是人类认知世界方式的革命性延伸,将推动人机协同向更智能、更高效的方向演进,为人类文明发展注入新的动力。





京公网安备 11011402013531号