语音|腾讯系AI语音助手:从家居场景到全面上车,还要打通小程序

_原题为 腾讯系AI语音助手:从家居场景到全面上车 , 还要打通小程序
从2011年苹果公司推出Siri起 , 人工智能语音助手就开始常伴我们的生活 。 Siri之后 , 微软的Cortana、亚马逊的Alexa、谷歌的Google Assistant、三星的Bixb陆续诞生 。 国内公司中 , 小米有小爱同学 , 百度有小度 , 腾讯有小微 。
各家人工智能语音助手大多以手机或智能音箱为载体 , 在语音识别、自然语言处理等关键技术上 , 它们一直在进步:慢慢能听得懂口音方言 , 完成稍复杂的指令甚至多轮对话 。
不过 , 这么多年过去 , 对于普通用户来说 , 常用的人工智能语音助手的功能好像还是那几样:问个天气、点一首歌、上个闹钟、讲个笑话 。
点个外卖?还不太方便 。 深度聊天?它还是有些笨拙 。 使用过程中 , 语音助手真正能实现和调度的功能仍比较有限 。
“可能用户在使用智能音箱时 , 去年在点歌 , 今年还是在点歌 , 这也是国内所有品牌的智能音箱面临的共同问题 。 ”在2020世界人工智能大会期间 , 微信AI专家周杰向澎湃新闻(www.thepaper.cn)采访人员表示 。
微信团队推出了“微信对话开放平台”和智能对话系统腾讯小微 。 截至目前 , 小微已进入 Bose耳机、Marshall音箱等多款硬件产品 。
公认的趋势是:随着5G和物联网(IoT)时代来临 , 语音交互方式的重要性显著提升 。 但如何让人工智能语音助手的技能实现真正的提升?能够实际调度的功能、连接智能硬件数的多寡是决定性因素 , 这成为各派系语音助手竞争的焦点 。
周杰介绍 , 希望能够逐步拓展腾讯系人工智能语音助手腾讯小微的“技能点” , 微信AI团队今年的重点工作就是对内让“小微”打通微信生态的功能 , 对外让“小微”进入更多的硬件设备 , 实现多设备端的联动 。
连接服务与硬件
目前的腾讯小微 , 除了基础功能(闹钟提醒、天气、翻译等) , 主要提供的是腾讯体系内的能力:比如QQ音乐、企鹅FM、腾讯新闻等 。 这是腾讯相较百度“小度”等智能语音助手的优势所在:腾讯生态下的可获得的内容和服务相对更丰富 。
在此基础上 , 小微希望未来能够与微信小程序打通 。 “小程序开发者非常多 , 每个小程序都在提供一个或者多个服务 。 ”周杰说 , “现在大家用小程序 , 都是通过触摸点击 , 以后能做到用语音拉起 。 比如你想点菜 , 那么直接就用语音来让用户直达点菜的页面 。 ”
此外 , 周杰称 , 小微未来会进入更多语音交互方式有天然优势的硬件 。
周杰介绍 , 其团队内部已经与腾讯视频成立联合项目组 , 腾讯视频和设备厂商合作推出了极光盒子、投影仪等产品 。 “我们希望在视频场景下能够使用语音 。 毕竟用遥控器找节目、找到第几集、哪一期 , 我觉得这非常复杂 , 而语音一句话就可以解决 。 ”
在更多硬件上搭载语音助手 , “All In”这一思路的还有把AI和IoT写进公司战略的小米 。 截至今年3月31日 , 接入小米IoT平台的设备数达到2.52亿 , 人工智能助理“小爱同学”的月活跃用户数达到7050万 。
家居场景之外 , 各家人工智能语音助手正争相上车 。
百度正是用“小度” , 切入车联网领域 。 小微也已纳入腾讯车联网方案中 , 不只是用于操作车载微信 , 腾讯的车联网系统还做了“腾讯小场景”产品 , 类似于让小程序(如哔哩哔哩、喜马拉雅、美团、猫眼娱乐等)上车 , 这让语音助手在车上可实现更多功能 。
解决真正的需求
不过 , 为AI语音助手增加技能点也有诸多限制 。
首先 , 人工智能语音助手目前所“容身”的硬件 , 并不是每一款都像手机一样有着强大的CPU、GPU 。 这意味着 , 语音助手在手机上可以轻易调度小程序 , 让小程序的功能为己所用 , 但在音箱等物联网设备上跑起这些程序存在难度 。
其次 , 是否要上线一项功能 , 最关键的是弄清楚用户的需求究竟是什么 。 就比如 , 用语音操控智能音箱、电视、汽车点外卖 , 真的会有这样的需求吗?
周杰称 , 希望让语音所唤起的服务 , 满足的是用户真正的“细粒度”需求 , “一定要真正、直接的去解决用户问题 , 而不是为了迎合用户广泛的观点 。 ”
输出技术能力
在人工智能语音助手成长为几乎无所不能的钢铁侠搭档“贾维斯”(J.A.R.V.I.S.)前 , 这些互联网科技公司们所积累的语音识别、自然语言处理等能力等 , 不仅仅是用于成为我们的语音助理 , 实际上已经可以完成一些特定场景下的任务 , 有了更多商业化可能 。
比较直观的 , 是微信聊天窗口的“语音转文字” , 这背后就用到了来自微信智聆团队提供的语音识别技术 。 越来越多的公司采用的机器人客服 , 则是借助了人工智能语音助手自然语言理解、知识图谱等底层能力 。
在走技术开放路线上 , 小微的前辈 , 是诞生更久的微软小冰 。
7月初 , 微软公司宣布将人工智能小冰业务分拆为独立公司运营 。 微软称 , 小冰将深入在对话式人工智能引擎上的革新 , 进一步联合各地合作伙伴 , 为大中华地区、日本和印度尼西亚的广泛客户 , 提供完整的人工智能技术和方案 。分页标题
基于微信生态 , 微信AI也想将技术能力输出给微信公众号、小程序等各类开发者 。 周杰介绍 , 微信AI的对话开放平台可让开发者快速开发“客服机器人” , 配置闲聊、点播音乐、视频和新闻等多项技能 。
周杰称 , “其他公司想做对话开放平台 , 可以围绕微信对话开放平台所提供的底层能力和各种接口他们进行二次的封装 , 包装成新的前端网站 。 ”
【语音|腾讯系AI语音助手:从家居场景到全面上车,还要打通小程序】(本文来自澎湃新闻 , 更多原创资讯请下载“澎湃新闻”APP)