登录体验完整功能(收藏、点赞、评论等) — 立即登录

少找工具,多做创作

高德发布全球首个大模型驱动视觉认知步行导航系统“地标AI领航”

2026年3月6日,高德地图正式推出全球首个由大模型驱动的视觉认知步行导引系统“地标AI领航”。该系统深度融合千问大模型、亿级POI数据与千万级街景图像,首次让导航具备视觉认知与人类语言理解的空间智能感知能力,精准解决步行场景中方向模糊、进度感知弱、终点难确认三大核心痛点,实现“所见即所导”的直觉式出行体验。

当你在错综复杂的老巷子里寻找深藏的特色小店,或是在人流如织的高铁站出站口对接友人时,传统步行导航的“向北行进30米左转”指令,往往无法帮你快速锚定方向——方向感缺失、距离感知模糊、终点位置不确定,这些是长期困扰步行导航用户的核心难题。3月6日,高德地图的一款全新产品,为这些痛点提供了针对性的解决方案。

传统步行导航的核心逻辑是基于坐标的方向与距离指引,但这种模式完全忽略了人类日常认路的习惯:我们更依赖眼前的地标、建筑、商铺等视觉信息来判断路线。高德的调研显示,步行导航用户普遍面临三大痛点:起步阶段方向感模糊,无法快速匹配导航指令与真实环境;行进中对剩余距离和步行进度缺乏直观感知,容易走冤枉路;到达目的地附近后,仍无法通过导航确认准确终点位置。

“地标AI领航”系统的出现,正是用大模型能力重构了这一逻辑。它不再输出冰冷的坐标指令,而是像真人指路一样,调用用户眼前的真实地标作为导航参照,比如“穿过前方蓝色玻璃写字楼后右转”“在路口的连锁奶茶店门口左转,目标就在右侧巷子里”,让导航指令与用户的视觉所见完全同步,从根源上消除认知负担。

这款全球首个大模型驱动的视觉认知步行导引系统,其技术核心在于多模态能力的深度融合。它一方面接入千问大模型,实现对人类语言的精准理解与生成,能将复杂的路线信息转化为符合日常交流习惯的自然语言;另一方面,整合了高德积累的亿级POI(兴趣点)数据与千万级街景图像,让系统具备“看见”并识别真实环境的视觉认知能力。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创