高德地图携手通义实验室,深度共建全球首个AI原生出行智能体

钛媒体AI
2025年8月12日 05:52
#AI资讯 #钛媒体AI

在AI原生浪潮推动下,阿里巴巴集团旗下高德地图与通义实验室宣布达成深度合作,并在近日发布的高德地图2025版本中落地多项共建成果。

双方围绕语音交互、大模型能力以及Agent等核心方向展开全面协同,共同推动高德地图从“连接世界”迈向“理解世界”的全新阶段。

全链路语音共建:更精准、更自然的交互体验

作为全球首个AI原生地图应用,高德地图2025的核心亮点之一,是推出业内首个专精出行生活的智能体“小高老师”,它可基于音频、文本输入等多模态方式,与用户直观交互。

在语音能力上,高德与通义实验室语音团队联合打造了覆盖唤醒、识别、理解、播报等环节的全链路能力,助力“小高老师”实现了行业领先的识别精度和交互流畅度。

双方构建的新一代语音语义感知系统,由高德导航专用ASR(语音识别)模型、通用领域大模型ASR、高德大模型综合理解能力等模型组成,全面覆盖导航、本地生活、日常闲聊三大场景。

此外,全双工语音技术的应用,让用户体验“小高老师”时可随时打断并发起新指令;抗回声处理则确保用户在复杂声学场景下依然能保持清晰、顺畅的交互体验。

大模型底座加持:通义Qwen赋能空间理解

在用户使用过程中,“小高老师”能高效调度高德内部近百种工具,将内外部数据资源整合分析,生成最佳回答反馈和地图交互动作。

支撑这一能力的,是高德和通义共建的大模型簇——该模型簇由多模态空间感知、行为认知、时空意图理解、总结输出交互和反馈观测评估等多个专业模型构成。

通义大模型具备全球领先的预训练规模与语义理解能力:Qwen2.5已在18万亿token上完成预训练,而Qwen3的数据量几乎翻倍,达到约36万亿token。

凭借强大的底座能力,通义大模型已成为全球主流的基座模型之一。综合Hugging Face、魔搭等社区数据,Qwen系列大模型的下载量已达4亿次,同时衍生模型数量超过14万个,位居全球第一。

基于通义Qwen模型的底座能力,高德通过SFT(指令微调)训练,显著提升了其在出行生活场景中的语义理解、上下文感知与响应能力。

智能Agent登场:出行决策化繁为简

在Agent领域,基于高德自研的DeepResearch框架,通义实验室和高德联合开发了地图领域的复杂POI推理Agent,可通过理解多重约束条件、有效使用地图和搜索工具以及整合实时联网信息,为用户提供精准的POI推荐与导航服务。

该DeepResearch框架融合了强大的规划(Planning)、反思(Reflection)和工具调用(Tool Calling)机制,具备对高德地图全栈工具的深度理解和使用能力,能够智能地拆解复杂任务、评估执行路径并高效协调各类工具。

基于此框架开发的推理Agent具备三大能力:

首先,基于双方共建的高德专属推理能力模型,该Agent具备了地图领域领先的多维POI推理能力,可实现复杂时空需求的理解以及复杂POI的解析及处理,支持对事件、地理、参与者、时间、交通、POI属性等多重约束的综合判断;

其次,该Agent为高德预置了专属地图API、实时天气查询、交通状况监测、POI数据查询API等工具,并能基于POI理解自主调度相关工具。同时,它还能轻松集成新的工具和数据源,以适应不断变化的场景需求,无论是新增的POI类型、交通方式还是实时数据,都能快速适配并提供相应服务。

最后,该Agent可实现复杂场景下的POI任务处理,例如多POI路线规划、实时约束下的POI推荐、定制化POI推荐以及长时间旅行规划建议等。

“模型+场景”深度融合:AI能力落地的行业范式

此次合作,不仅是高德与通义实验室技术能力的叠加,更是生态协同共建的深度实践。通义大模型的泛化能力与高德在空间场景上的深度积累,在AI原生地图中实现了前所未有的深度融合。

一方面,高德以通义大模型为AI底座,构建了具备理解真实世界能力的空间智能,这不仅赋能高德地图APP迭代升级,未来还能驱动智能汽车、智能眼镜、具身智能、低空飞行等领域的变革。

另一方面,通义实验室则通过高德地图这一海量用户场景,推动大模型能力的真实落地与验证,加速其在C端产品中的规模化应用。

可以预见,高德与通义实验室的合作将成为“模型+场景”跨域融合的行业范式,为AI能力在更多真实世界场景中的落地提供可复制的实践经验。


更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App


最新资讯

亚马逊云科技入局Vibe Coding,推出Kiro重塑开发流程

7月17日
11

马斯克的XAI推出【智能伙伴】功能,居然支持18禁模式?

7月15日
24

Google开源了一个AI命令行神器,程序员狂欢!这就是传说中的Gemini CLI

6月26日
49

Cursor AI编程工具模型全面解析:2025年最新完整模型列表与深度对比

6月18日
149

用Veo 3+Suno做了个AI Rapper,吊打音乐节上的流量明星

5月30日
11

热门工具

Cursor

Cursor

Cursor是一款AI驱动的代码编辑器,专为提升开发者生产力而设计。它集成了强大的AI功能,包括智能代码补全、自然语言编程、代码生成和重构等,让编程变得更加高效和直观。

Kimi

Kimi

Moonshot AI推出的智能助手,支持200万字超长文本处理,具备强大的文档理解分析能力、多格式文件解析和深度推理功能,适合学术研究和商务应用。

DeepSeek

DeepSeek

DeepSeek是一家专注于AGI的AI公司推出的大语言模型,具备O1级别的深度推理能力、强大的代码生成能力和数学推理能力,以极低成本提供高质量AI服务。

ChatGPT

ChatGPT

OpenAI公司开发,AI时代的开创者和先行者。

Leonardo.Ai - Image Generator

Leonardo.Ai - Image Generator

Ai , the ultimate AI art image generator, now available on iOS

Microsoft 365 Copilot

Microsoft 365 Copilot

Microsoft 365 Copilot 应用是一款用于工作和生活的日常高效办公应用,可帮助你在一个应用中随时随地使用 Microsoft 365 Co...,支持多种AI功能。

创客贴设计-AI海报图片设计、拼图抠图作图神器

创客贴设计-AI海报图片设计、拼图抠图作图神器

创客贴设计--“打工人”必备AI作图神器 创客贴设计为用户提供丰富的AI智能作图工具,如AI海报、AI商品图、智能抠图、AI消除、智能改图、AI绘画等,输...,支持多种AI功能。

百度文库-DeepSeek R1联网满血版

百度文库-DeepSeek R1联网满血版

百度文库,一站式智能写作与文档资源集合平台,正式接入DeepSeek R1满血版,文档查找、编辑、资料管理一应俱全,AI内容生成能力再升级,办公学习好助手,支持多种AI功能。