高德发布全球首个由大模型驱动的视觉认知步行导引系统

IP属地中国·北京 编辑：任飞扬 TechWeb 时间：2026-03-06 19:04:57

3月6日消息，近日，高德地图正式推出全球首个由大模型驱动的“视觉认知步导”系统——地标AI领航，该系统深度融合千问大模型、亿级POI与千万级街景图像，让导航系统首次具备了“视觉认知与人类语言理解”的空间智能感知能力。
在导航场景中，用户常常面临三个主要痛点：起步时方向感模糊、对距离与步行进度缺乏直观感知、到达目的地附近仍无法确认准确终点。
高德基于多模态人机交互、地理语义理解与生成式AI应用上的突破，推出了更符合人类指路习惯的视觉认知导航，有效解决了上述痛点，为用户提供零认知负担的“直觉式行走”体验。
人类在日常指路时常用“在那边”“走那条路”“穿过红色建筑”“下个路口有排餐饮店”等表达方式，通过融入当前环境的地标参考，让路线信息更明确，其核心依赖“方向语义+地标锚定+上下文感知”的认知逻辑。导航工具若要达到人类语境下的指路效果，首先需要构建覆盖真实世界、可听可视的地理语义网络。
为此，高德地图基于三大核心能力，建立导航系统对空间关系的深度理解：超亿级POI数据库、高精度步行路网拓扑，以及覆盖全国大部分城市及景区的千万级高精街景图像。结合千问的多模态能力，系统可识别交通设施、商铺、地标建筑等实体，并评估其视觉显著性，从而生成更符合人类习惯的自然语言描述。
真实场景中，并非所有POI都适合用于指引，地标不清、提示不准会导致用户拿不准“第几个路口转”“何时该提醒”。为提升指引有效性，高德地标AI领航采用“双重筛选”：一是时空关键节点筛选，仅在起点、转弯、偏航及临近终点等决策点播报；二是显著感知筛选，优先选择更醒目、更易识别的参照物，如地铁标识、银行大牌、餐饮招牌等。
同时，播报文案采用更口语化、具象化的表达，突出颜色、形态与相对位置（如“左侧第二个玻璃门”），并根据场景动态调整详略。实测显示，用户在听到视觉地标提示后，平均比传统导航快2秒确认正确路径，减少看手机频次，进一步降低老人、亲子家庭、游客及注意力易分散人群的步行出行门槛。（周小白）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

AI重塑钢铁全产业链南钢元冶生态大会落地200余项工业大模型应用

暗讽苹果自食其果？美光高管：部分客户激进压价加剧存储短缺

AI到底有多饥渴：5秒AI视频=10部手机充电量 10次提问=1瓶矿泉水

GPT-5.6紧急叫停，OpenAI最强模型被迫“一客一审”

你的Codex 可能只解锁了1%，大神让它一天肝71小时

加速“星舰”发射频率：马斯克SpaceX拟建约13公里天然气管道

全站最新

AI重塑钢铁全产业链南钢元冶生态大会落地200余项工业大模型应用

暗讽苹果自食其果？美光高管：部分客户激进压价加剧存储短缺

AI到底有多饥渴：5秒AI视频=10部手机充电量 10次提问=1瓶矿泉水

GPT-5.6紧急叫停，OpenAI最强模型被迫“一客一审”

热门推荐

AI重塑钢铁全产业链南钢元冶生态大会落地200余项工业大模型应用

何小鹏：2026 年底自动驾驶可以合法进入全球

暗讽苹果自食其果？美光高管：部分客户激进压价加剧存储短缺

AI到底有多饥渴：5秒AI视频=10部手机充电量 10次提问=1瓶矿泉水

GPT-5.6紧急叫停，OpenAI最强模型被迫“一客一审”

你的Codex 可能只解锁了1%，大神让它一天肝71小时

加速“星舰”发射频率：马斯克SpaceX拟建约13公里天然气管道

特斯拉2026免费超充挑战赛开启九名车主可获终身免费超充

苹果Mac、Pad涨价亚洲果链几乎全线遭殃立讯精密逼近跌停

企微拉群不超40人无需本人同意：老人频遭广告骚扰微信客服回应

乐道L60完成第10万台新车交付，位居20万级纯电中型SUV前三

消息称三星卢泰文访问京东方、TCL、华星光电等，讨论电视和显示面板业务

乐奇Rokid全球首发AI眼镜微信扫一扫功能，还支持一句话打车

网易：自6月30日起将成为香港联交所双重主要上市公司

格力电器知识产权维权进展通报：七人侵权被判有期徒刑