深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿


_本文原题:语音 AI 向车载场景拓张 , 3 年 4 大战场全回顾 , 以及未来展望 | 特稿

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
编者按:车载语音历经 3 年发展, 普及率比智能音箱高出 45% 以上 , 玩家横跨平台商、AI 技术服务商、车载配件设备商、手机厂、车厂 。 这是一个持续升温的大市场 , 预计到 2028 年 , 全球近 90% 的新车将标配语音助手 。
就让我们一起跟随这篇文章 , 俯瞰车载语音的中场战事 , 洞悉智慧出行变革的未来!
温馨提示:点击小程序「湾里湾外随身听」可以随时「收听」本文 。 让深度思想倾耳可听、触手可见 。
福特 SYNC 平台于 2007 年首次推出 , 支持通过蓝牙连接移动设备和语音命令 。 2017 年 , 在亚马逊的推动下 , 已经升级为 SYNC 3 的福特智驾系统 , 完成了与 Alexa 的语音集成 , 用户可以在家中与 Echo 智能音箱对话 , 完成打开车窗、空调等指令 。
而此次福特、亚马逊和星巴克联手推出的语音点咖啡的功能 , 透露着语音助手已经开始从家中逐渐走向车内 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ 福特 SYNC 3 集成 Alexa
几乎是在同一时间 , 在 2017 年 3 月 30 日这一天 , 大洋彼岸的大众汽车集团(中国)与人工智能公司出门问问签署了合作协议 , 确定将共同成立一家合资企业 , 由大众汽车集团与出门问问共同持股 , 双方各持 50% 的股份 。 同时 , 大众汽车集团对出门问问战略投资 1.8 亿美元 , 双方联手展开人工智能技术的研发 , 并将其应用于汽车行业 。
大众汽车集团在汽车和移动出行领域的领导地位不必赘述 , 选择出门问问更多的是看中了其软硬结合的能力——出门问问在 AI 语音领域拥有多年的技术积累 , 在智能家居和可穿戴设备等消费级硬件领域 , 也有多年的应用探索 。 大众汽车集团与出门问问的联姻广受行业和媒体关注 , 成为推动车载语音从 demo 走向「大众」的重要力量。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ 一汽-大众新迈腾智能车机
如今 , 3 年过去了 , 车载语音领域发生了很多事 , 很多车企和语音公司也都陆续交出了答卷 , 我们对于行业的认知和趋势的判断 , 也在悄悄的发生变化 。 就让我们一起梳理一下吧:
【深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿】过去 3 年 , 车载语音 4 大战场逐步升温
纵观整个车载语音行业的发展历史 , 我们将目光聚焦在以下 4 大战场:
一号战场:语音 AI 巨头车载场景赋能战
2017 年 , 随着 , 两家巨头纷纷将战场 。
第一阶段 , 与传统车企合作 , 将各家的语音助手引入到部分车型上 , 通过手机和第三方设备 , 在车内实现导航、听歌、打电话等基本的语音交互 。 第二阶段 , 与传统车企合作 , 将语音助手植入到车机系统中 , 实现双向且更多与车辆相关联的控制 。
Google 于 2017 年宣布中 。 亚马逊则于次年 , 帮助车厂完成更深度的语音助手的集成 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ Google 在 CES 2020 上展示的内置了 Android Auto 的 Volvo XC40
二号战场:车载配件市场升温
车载配件市场的热度也在这一轮语音 AI 巨头的推动下 , 出现了大幅的提升 。 、 Roav Viva 、Muse 等搭载了亚马逊 Alexa 或 Google Assistant 语音套件的智能硬件 , 纷纷走进车内 。分页标题

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ Garmin Speak
2018 年 10 月 , 亚马逊推出了车载后装产品车载连接器 Echo Auto 。 接入汽车电源口 , 通过蓝牙连接已安装 Alexa app 的手机后 , 便可用语音交互获取 Alexa 的在线服务 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ Echo Auto
国内市场 , 早在 2016 年 , 出门问问的 第一代智能车载产品问问魔镜 TicMirror 和问问魔眼 TicEye 发布 , 率先将语音交互引入到车载配件市场 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ 问问魔镜 Ticmirror (智能后视镜)和问问魔眼 Ticeye(ADAS 系统)
一个月后 , 国内的百度推出旗下首款语音智能车载产品—— 小度语音车载支架, 通过一个简单的手机支架(+车充)+ 双麦克风阵列 , 匹配手机 app , 实现百度云端资源和服务能力的对接 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ 集成了百度地图和百度语音助手「小度」的小度车载支架
不难看出 , 这类小「配件」产品 , 以及相应的蓝牙协议/平台的发布 , 意味着用户可以以最小的成本将语音助手服务移植到车载场景 。
三号战场:手机厂商开启「驾驶模式」
与此同时 , Google、小米等手机厂商也 打造了场景化的「驾驶模式」, 允许用户在车里直接通过手机唤醒语音助手 , 打开「信息仪表盘」并调用相应的服务 。
与手机语音助手的深度整合 , 也透露着手机厂商的语音助手「全场景、跨设备」的发展规划 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ Google I/O 2019 亮相的 Pixel 手机的「驾驶模式」
四号战场:传统车企打造自家语音助手
在 2017 和 2019 的 3 年间 , 福特、宝马、现代、尼桑等一线车企开始加大投资 , 或将 Google、亚马逊等语音 AI 能力整合到自己的系统中 , 或与 Nuance / Cerence 等嵌入式语音公司合作 , 为新车定制更智能、体验更好的语音助手 。
而在国内战场 , 大众汽车集团与出门问问、上汽与阿里、广汽与腾讯、小鹏与思必驰、蔚来和吉利与科大讯飞 , 纷纷在携手后交出了答卷 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ 亚马逊在 CES 2020 上宣布与兰博基尼合作
车载语音是刚需 , 完善体验是前提
毋庸置疑 , 与家居和随身场景相比 , 车里的语音交互更具刚需 。
你可以不必开口向智能音箱或 AirPods 发出指令 , 但你在开车的时候 , 用语音命令打开空调、调用导航、或回电话 , 安全价值业已成为新生代驾驶员的交互习惯 。
两个月前 ,来自 Voicebot 的一份消费者调研报告 显示 ,在美国 , 有近 1.3 亿人使用车载语音助手 , 普及率比智能音箱高出 45% 以上 。
使用车载语音助手的活跃度也在提升 , 月活跃度为 64.6% , 车载语音助手的月度活跃用户几乎与智能音箱所有者的总数一样多 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
资源分享:关注深圳湾(微信号:shenzhenware)公众号 , 在对话窗口输入「auto 2020」或「车载语音报告」 , 下载完整报告 。
我们预见车载语音将成为未来智慧出行和自动驾驶的重要组成部分 , 甚至在三年前 , 深圳湾就曾这样预言过 。 而随着消费者使用习惯的逐渐养成 , 语音助手的普及不仅仅是语音 AI 厂商在推动 , 越来越多的车企加入到这场变革中 , 并发挥着越来越重要的作用 。分页标题
但语音助手的交互体验上 , 还存在着或多或少的问题 。 比如 , 在车厢内风噪、胎噪、多人会话的场景 , 语音识别不准确;再比如 , 对行车中的特定语音控制命令和对话内容理解不到位;还有 , 不能与车内的仪表盘控制系统整合在一起 , 等等 , 都极大的影响了用户的体验 。
亚马逊 Alexa 最近的一份调查显示 , 在各项车载语音能力中 , 车载语音识别满意度最低 。 这也折射了车载语音场景的复杂度 , 相对家居场景 , 要复杂的多 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ 亚马逊 Alexa 车载语音满意度调查(来源:Voicebot)
前三年的探索 , 让我们看到了 , 不单是手机等智能设备在车载场景的交互方式受限 , 更重要的是 , 将通用语音助手移植到车载场景的做法 , 存在着很多的局限 。 要打造体验更好的车载语音交互系统 , 必须要针对车内场景做深度的定制和优化 。
车载语音 , 前装是关键 , 但并不简单
我们再回顾过去 3 年 , 在大众汽车集团和出门问问联姻后 , 看出门问问是如何解决如上的问题的 。
当时很多媒体将这一联姻当做一次融资事件解读 , 其实 , 更重要的意义是 , 别家还在各车厂拜访打关系的时候 , 出门问问已经稳稳的攥到了前装市场的门票 。
前装的方式能够解决后装智能设备的诸多问题 , 包括针对车载环境的语音交互效率 , 以及车载设备的控制等等 。
出门问问创始人李志飞曾经表示 , 出门问问 AI 研发团队「70% 的精力花在前装车载语音交互技术的打磨上」 。 一方面是因为大众汽车集团的要求非常苛刻——问问的工程师描述为「近乎到变态」 , 另一方面 , 尽管需求不断提升和变化 , 但问问的研发团队都给予了「超乎预期的」满足 。 现在看来 , 尽管一路坎坷 , 但「前装」策略还是很快见到了成效 。
2018 年 , 出门问问的车载核心 AI 语音交互技术已通过旗下合资子公司大众问问落地于江淮大众 SOL(思皓)E20X 的前装中 , 大众问问还与德赛西威联合打造并发布了智能车机产品 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ 德赛西威-问众智能车机
据官方透露 , 截至目前 , 出门问问主导研发的车载语音交互系统已经落地在大众汽车集团旗下新迈腾家族系列、帕萨特、奥迪等多个主流车型 , 2020 年预计将落地 100 万辆全新汽车 , 若以此增速 , 到 2023 年将可落地近 1000 万辆 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ 出门问问车载语音交互系统落地车型
两年多的时间里 , 出门问问研发了一整套离在线结合的嵌入式车载语音交互系统 , 实现了完整的语音交互 , 包括前端信号处理、固定唤醒词、自定义唤醒词、快词指令(比如车载地图控制和音乐控制命令)、语音识别、自然语言理解、对话管理、语音合成等 。
如何理解离线混合呢?我们在行车的大多数状况下 , 使用的是移动蜂窝网络 。 尽管大部分的高端车已经实现了 100% 的网络渗透率 , 但仍有很多诸如隧道等复杂的网络环境让我们处于离线状态 , 这个时候只支持在线的系统就无法即时反馈语音交互需求 。
而有了这套离线和在线的混合系统 , 驾驶者不仅能在离线情况下 , 使用车内语音交互来实现多种车控功能 , 同时也能够快速触达多项服务 。
为应对车规级的严苛标准 , 出门问问将系统内存控制在 450M 以内 , CPU 占用低 , 整体响应时间快 , 在识别效果、播报体验、响应时间、资源消耗等目标中 , 都达到了非常好的数据指标 。
值得一提的是 , 出门问问首次在前装系统中实现了全场景打断(all-scene barge-in)、自定义唤醒词、无间断连续查询(one shot)、智能等候(always on)等众多功能 , 语音交互能力获得了极大的提升 。分页标题
我们可以从这个视频中更好的理解这些技术是如何应用在车载环境中的 , 简单举两个例子 。
你好 , 帕萨特 。 // 自定义唤醒词 , 你也可以说 , 你好 , 大众 。
我想吃火锅 , 吃点心 , 吃小笼包 。 // 间断连续查询 , 期间不需要重复唤醒 。
其实 , 这些技术应用在家居和可穿戴场景并不陌生 , 出门问问也已经有了多年的沉淀 , 如今拓展到车载场景 , 虽说可以「轻车熟路」 , 但其实并不简单 。
出门问问的团队告诉深圳湾 , 车载场景的复杂度不仅体现在网络上 , 车厢内风噪、胎噪、多人会话的场景为语音识别制造了很多麻烦 , 这也是为什么此前基于后装设备的车载语音满意度低的主要原因 。
另外 , 车载环境下 , 还存在诸如驾驶者不希望其他乘客唤醒语音助手的需求 , 这种需求在其他语音交互载体(如智能音箱)上不常出现 , 但却要求车载语音交互系统具备定向收音的功能 。
还有 , 车内的人机对话与家里的人机对话也有很多的不同 , 家里常用到的闲聊和知识问答等对话 , 在车中并不常见 。 出门问问针对车内的主要对话内容做了新的知识图谱的梳理 , 做到对于特定语音控制命令可以理解到位 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
在 今年年初深圳湾对出门问问创始人李志飞的专访 中 , 曾经聊到这个话题:车载语音为什么不能像智能音箱一样 , 既叫好、又叫座?李志飞的解答是:
语音交互虽然在其他类型的设备上存在了很长时间 , 但真正符合车载刚需场景标准的产品刚刚开始在市场上普及 , 消费者需要时间去体验真正带来用户利益、解决车载痛点的产品 。 叫座只是时间问题 。
对于这套预装在大众新车里的离在线语音交互系统 , 李志飞信心十足:
出门问问在车载嵌入式语音交互技术的积累非常多 , 原因是我们有一个非常挑剔的伙伴就是大众汽车集团 。 我们做出了一整套离线系统 , 在全球都是领先的 。 本地的自然语言理解、本地搜索、本地唤醒 , 这在全球都是非常有竞争力的 。
当被问及 , 大众新车是否只是小规模应用?李志飞的回答是:
不 。 今年 , 预计将有 100 多万辆车 , 会用到这套离在线的系统 。
车载语音推动智慧出行的变革
在 2019 年的「超级碗」广告中 , 梅赛德斯·奔驰将语音作为了广告的主旋律 , 一句「Hey Mercedes」成为了焦点 。
这是一个非常重要的信号 。 过去 , 梅赛德斯·奔驰等汽车制造商的新车广告通常会在汽车的物理性能(如造型、动力、安全性、内饰、影音系统)上大做文章 , 而这一次 , 它向人们展示了基于 MBUX 系统的语音助手 , 为驾驶带来的无以伦比的便利 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
△ 梅赛德斯·奔驰的「超级碗」广告(节选)
行业研究机构 Navigant Research 预测 , 到 2020 年代中期 , 将有 90% 以上的新车具有内置数据连接的能力——虽然目前主要是通过 LTE , 但到 2022 年左右 , 将会普遍使用车载 5G 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
而随着 5G 等基础网络设备的日渐成熟 , 将有更多的车辆原厂内置语音助手 。 预计到 2028 年 , 全球近 90% 的新车将标配语音助手 。

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
过去几年 , 我们在家居和可穿戴领域 , 看到了很多类似的增长数据 。 而在车载领域 , 我们同样有理由相信 , 就如同语音 AI 极大的推动了智能家居的普及一样 , 车载语音将加速未来智慧出行的变革 。 ■ 分页标题
主笔:陈壹零/ 深圳湾
编辑:四时 / 深圳湾
题图来源:Just AI
/////////////
湾里湾外·号外
深圳湾锐见 , 炫姐姐读给你听
疫疾去黄鹤复返 , 群贤至曲水流觞 。
在冬去春来季节交替之际 , 深圳湾联合 AI 拟真语音平台「出门问问魔音」推出模拟真人发声的音频内容 。
只要点击小程序「湾里湾外随身听」就可以随时「收听」深圳湾的推文 。 让深度思想倾耳可听、触手可见 。
原则上 , 个性化 TTS 仅需要录入 20 句人声音频内容 , 即可生成颇像真人的专属合成效果 。
而针对深圳湾的深度内容 , 为达到更高规格的合成效果 , 出门问问帮助我们录入了 500 句「深圳湾的炫姐姐」的语音素材 , 生成了 MOS 值(语音质量度量标准)达 4.2 的语音合成系统 , 为深圳湾的深度思想赋予了炫姐姐的个性声音 。
用 AI 唤醒未来 , 为深度思想赋予个性声音 。 祝愿我们早日迎来黄鹤复返 , 曲水流觞 。
出门问问@深圳湾

深圳湾|语音 AI 向车载场景拓张,3 年 4 大战场全回顾,以及未来展望 | 特稿
本文插图
// 新品解读//
// 策略解读//
真知灼见的科技采访人员
四通八达的运营编辑