电商在线|淘宝直播首次完整展现核心秘密:5年前布局技术,达摩院加持



电商在线|淘宝直播首次完整展现核心秘密:5年前布局技术,达摩院加持
本文插图
很难想象 , 直播带货这项带着娱乐性的消费体验 , 背后站着最不可能看直播的一群人 。
8月7日 , 阿里巴巴访客中心的一间会议室里 , 淘宝直播的产品经理和达摩院的科学家们坐在一起 , 面对几家媒体揭开了淘宝直播背后的技术——这还是直播平台第一次公开自己最核心的秘密 。
淘宝直播团队里 , 大部分都是技术、产品研发专家 。 除了自己“兼职做主播”的产品经理 , 还有不停满足产品经理需求的技术大牛们 。 这群顶级科学家 , 将前沿技术应用到每一声“OMG , 买它”和“3、2、1 , 上链接”中 。
对商家和消费者来说 , 这些技术几乎是无感的 。 但每一项好用的直播工具和一次流畅的观看体验背后 , 都是产品经理和程序员们“斗智斗勇”之后的结果 。
据国泰君安零售团队测算 , 淘宝直播的市场份额占比超过58% , 并保持高速增长 , 阿里巴巴最新一季财报显示 , 淘宝直播连续八个季度保持同比100%的增长 。
与此同时 , 抖音、快手逐渐电商化 , 自10月9日起 , 抖音将不再支持第三方商品直播带货 。 但内容平台在试图自建供应链与商家体系的同时 , 仍然与淘宝、京东、拼多多等平台电商保持着紧密合作关系 。
2020 年 , 直播电商市场规模达 9610 亿 , 同比增长 111% , 接近万亿水平 。 整体来看 , 短视频与电商互有碰撞 , 但整体做大了直播电商的市场规模 , 仍是合作大于竞争的关系 。
淘宝直播这回首次亮出技术家底 , 或许正如业务负责人玄德提到的 , “更多人、更多平台加入 , 有助于直播电商模式的加速推进 。 这是我们乐意看到的 。 ”
如果要给这个直播时代找一句标志性话语的话 , 它一定是“3、2、1 , 上链接!”
它体现了直播带货特有的即时性和互动性——像一声发令枪 , 让无数直播间观众神经紧绷 。 淘宝直播甚至把首个直播购物节定在了“3月21日” 。

电商在线|淘宝直播首次完整展现核心秘密:5年前布局技术,达摩院加持
本文插图
“之前抢刘涛直播间里的低价iPhone时 , 我紧张到手心冒汗” , 一名直播忠粉对「电商在线」说 , “手慢一秒无” 。
万人同抢的热闹和紧张感 , 对商家来说 , 意味着更好的卖货氛围和更高的成交率 。 但对直播间的服务器来说 , 是一次技术挑战 。
去年双11 , 300万人同时在薇娅直播间里抢一件商品——当大主播和抢手尖货相撞 , 很容易引来巨大流量 , 而淘宝直播的服务器也会在巨流中经历一次洪峰冲击 。 放到过去 , 只有双11的零点 , 才会遇到这样的情况 。 而现在 , 随着淘宝直播规模迅速扩大 , 和直播间里频繁出现的秒杀活动 , 瞬间涌进的超高流量已经成为一种常态 。
卡顿、上链接延时 , 对主播来说都是一次翻车现场 。 评论区也会立刻出现不满 。
据淘宝直播团队介绍 , 百万人在线时 , 他们能将延时控制在1.5秒内 。 而其他直播平台的延迟时间大多为5秒-10秒 。 同时 , 淘宝直播的卡顿率比业界平均水平要低55% 。 这意味着不同消费者能在几乎同一时间接受到主播的画面和声音 。 支撑淘宝直播一秒上链接的技术被称为“大规模低延时” 。
“淘宝直播在这一‘时延’的指标上领先业界至少3年” , 淘宝直播产品负责人岱妍说 。
互动不即时 , 则直播无乐趣 。 抢购、秒杀等互动性极强的直播带货玩法 , 只有在低延时的情况下 , 才有可能真正“玩”起来 。 淘宝直播团队表示 , 互动延时的降低对成交和互动率有明显的提升 , 预计为商家增收数十亿 。
从另一个角度来说 , “大规模低延时”还意味着直播间抢购的公平 。
“如果有粉丝还看不到链接 , 其他人已经下完单付完款了 , 前面那批粉丝肯定会炸的” , 林珊珊团队负责人凌霄对「电商在线」说 。分页标题
林珊珊是和雪梨、张大奕同期的“资深网红” 。 她从微博的红人时代一路走到了直播带货时代 。 几年时间 , 林珊珊的店铺积累了972万粉丝 , 比迪卡侬天猫旗舰店的粉丝(900万)还要多 。 去年 , 她开始在淘宝直播带货 , 并卖出了8亿元的货 。

电商在线|淘宝直播首次完整展现核心秘密:5年前布局技术,达摩院加持
本文插图
由粉丝经济构筑起来的达人 , 需要尽可能满足更多人的需求 , 也需要保证直播间抢单的稳定和公平 。 现在 , 林珊珊一次直播能吸引20万人同时在线 , 他们来自不同地区 , 使用不同型号的手机 , 但能在同一时间看到直播间里挂上的商品链接 。
在直播间里买了商品 , 却找不到退货按钮 , 这是很多消费者下单后遇到的困境 。 淘宝直播的回放功能 , 成了消费者查看商品详情页、找到店铺和客服的途径 。

电商在线|淘宝直播首次完整展现核心秘密:5年前布局技术,达摩院加持
本文插图
对商家来说 , 直播回放也有好处 。
淘宝直播的回放功能 , 为每件商品都设置了节点 。 消费者对哪件商品感兴趣 , 可以点进详情观看 。 图文介绍和买家秀同时存在 , 是为了从多个角度了解商品 , 避免买到“照骗” 。 但如果没有买家秀时 , 直播能让商品展示变得更加完整 。
对商家来说 , 这种节点功能把流水的直播 , 变成了商品详情页 。 一锤子的直播买卖变得细水长流 , 有利于长久运营 。 因此 , 很多主播的淘宝直播间 , 有相当比例的消费是在“回放”中完成的 。 据凌霄介绍 , 林珊珊的直播间里 , 15%左右的成交都来自直播回放 。
实际上 , 回放功能并不单纯是一种商业选择 , 而是一种需要综合考虑技术和成本的门槛 。
淘宝直播拥有几百万主播 , 如果每个主播每天连播4小时 , 每天平台上都会产生巨量视频内容 , 占用大量的带宽 。 对一个直播平台来说 , 为了回放功能 , 花钱买带宽是个不太有性价比的选择 。
而淘宝直播的“窄带高清” , 让直播内容的留存和回放成为一种可能 。 “窄带高清” , 就是用更好的直播技术解决方案 , 在更低成本的条件下实现更高清的播放 。 淘宝直播团队介绍 , 他们用了阿里巴巴自研的S265编码器 , 让视频内容拥有更低的码率 , 相比业界通用的X265编码器 , 最多能节省40%的带宽 。
“窄带高清”不仅带来更低的宽带成本 , 最高分辨率达1020p的高清直播画面也有利于商家展示实物细节 。 直播电商虽然需要人货匹配 , 但大家更关注的是主播的人设和货的内容 。 不管是需要真实展示颜色的美妆行业 , 还是直播渗透率高达50%的珠宝行业 , 高清都是一个至关重要的基本条件 。

电商在线|淘宝直播首次完整展现核心秘密:5年前布局技术,达摩院加持
本文插图
淘宝直播团队介绍 , 除了用720p , 1080p分辨率做直播 , 他们用上了视觉增强 , 智能降噪 , 双声道高保真等技术来提升画质和音质 , 降低直播噪声 。
曾经的淘宝直播还加了滤镜 , 但很快 , 产品团队就将功能砍掉了——商品和主播在滤镜之下都无比美好 , 但消费者发现商品货不对版后 , 会选择退货 。 高退货率 , 对店铺对行业都不是一件好事 。
很多主播揭开自己快速成长或成功带货的秘诀时 , 都会提到数据“复盘” 。
不少平台都推出了监测直播数据的数据看板:抖音在今年4月推出了新抖 , 也有专门针对淘宝直播的第三方数据平台萤火虫、知瓜数据和达人记等 。 无一例外 , 这些看板都在监测直播之后 , 亮出数据 , 包含直播在线人数变化、商品销售数据、转化率、主播互动、粉丝画像等几个维度 。
但如何从一堆图表和数据中挖到价值 , 并不是所有主播都擅长 。
达人主播们往往背靠MCN机构 , 能够负担得起专业的数据分析师和有经验的运营人员——他们意味着高昂的人力成本 。 “聘请一个初级的数据分析师 , 至少要2万元月薪” , 岱妍说 。分页标题
并非所有人都能承担得起这样的专业人员 。 尤其当加入直播带货的角色越来越多元 , 起初只有达人带货 , 后来柜姐、农民、博物馆讲解员们纷纷入局 , 他们需要一个平价甚至免费的分析工具 , “让田间地头的农民大爷也能和世界500强企业用到一样的数据分析服务” 。
淘宝直播团队介绍 , 他们推出的智能直播助理 , 除了分析货品选择、进行粉丝分析 , 还会精确落到每一个关键帧 , 对音质和画质提出建议 。 譬如 , 一个商家能看到流量和销量的在线走势图 , 在流量最低点 , 他可以跳到回放了解直播中出现的问题 , 也能获得专业意见:如果观众的画像是价格敏感型 , 就会建议主播多聊聊产品优惠 , 获取更多互动机会 , 让用户停留更久 。
当淘宝直播团队找上门推荐虚拟主播的时候 , 林珊珊团队是犹疑的 , “我们一开始担心虚拟主播种草能力不强 , 甚至还可能会拔草” 。
但他们最终还是尝试了 。 结果令人惊喜:虚拟主播的直播首秀 , 有14.6万次观看 , 增粉240人 。 此后虚拟主播的几次开播 , 也都有近10万人观看 。

电商在线|淘宝直播首次完整展现核心秘密:5年前布局技术,达摩院加持
本文插图
淘宝直播团队目前推出的虚拟主播 , 并不是像美国虚拟网红Miquela那样 , 是个横空出世的IP , 而是照着林珊珊等直播红人捏的形象 , 人设自然也是这些主播自带的人设 。
不少主播在经历618和双11的高强度工作后 , 嗓子总是沙哑 。 李佳琦也曾公开表露过对自己主播的职业生涯能走多远的担心 。 而虚拟主播永不休息 。 林珊珊下播之后 , 她还能实时介绍商品 , 接住粉丝们的提问 。
“那些没赶上直播的 , 和深夜睡不着的粉丝 , 都会跑来撩这个虚拟主播” , 凌霄说 。
就目前而言 , 虚拟主播已经是人工智能领域最复杂的技术应用了 。 一般来说 , 虚拟人物如果只回答问题 , 或只跳舞 , 或只播报 , 都不难实现 。 但如果要让它同时满足这些条件 , 还要维持直播流程 , 并像一个真人主播一样具有感染力 , 用基于情感和意图展示商品 。 要同时满足这么多种形式的技术 , 被称为“多模态技术” , 难度非常高 。
但在阿里巴巴达摩院资深算法专家陈海青看来 , 一切技术都是为了让虚拟主播看起来和听起来更接近一个真实的人类 。 因此 , 技术难点被拆分成三个部分:声音、动作和多模态技术 。

电商在线|淘宝直播首次完整展现核心秘密:5年前布局技术,达摩院加持
本文插图
从声音来说 , 商家只需要提供半小时的录音 , TTS技术不仅能用主播的声音播报 , 还能用主播的声音说外语 。
虚拟人物的动作 , 可以通过捕捉真人的肢体动作和面部表情 , 直接复制到虚拟人物身上 。 同时 , 动作也能基于AI算法模型 , 做出合理的肢体动作 , 也会在说话时做出更协调更精细的面部表情 。
而虚拟主播需要理解直播脚本的内容 , 才能综合商品详情和用户评论等多模态内容 , 在直播间有人提问时给出个性化的实时语音回复 。
达摩院的科学家们定义了直播脚本的每一部分内容:譬如 , 强调产品卖点时 , 算法就会告诉主播做出动作幅度较大的动作 , 也会用在介绍卖点时用上带着情绪化“Oh my God”等感叹词 。
3D技术和人工智能技术结合之下 , 虚拟主播正在直播间里快速铺开——譬如天猫超市的直播间就推出了虚拟主播“猫小美” 。 但显然 , 目前的虚拟主播们还不可能是李佳琦们的终结者 。 它只是大主播们在空闲时段的一种补充 。
大家一直将2016年算作淘宝直播开始的起点 , 但2015年 , 淘宝就已经将互动直播技术引入到电商场景 。
5年以来 , 淘宝直播团队的科学家们 , 最关心的还是两个大命题:
1、怎样让直播带货变得更有吸引力?
2、如何让直播变得更流畅?分页标题
这两个问题 , 既针对普通消费者的观看体验 , 也针对商家们利用直播带货时的使用体验 。 不管是数据分析还是虚拟主播 , 都是为了增加互动 , 让消费者增加观看直播的时长 。 而大规模低延时和高清带宽的处理 , 则让整个直播购物的过程更流畅 。
Q:主播PK的是实力 , 包括技巧、选品等各方面能力 。 当我们有虚拟主播之后 , 每一个直播间不分明星、不分头中尾 , 都在用虚拟主播的时候 , 大家PK的是什么?
岱妍:其实是在讨论我们提供的先进生产力和我们实际运营能力之间的匹配 。
我们做虚拟主播有两层含义:第一个 , 主播没有播的时候 , 虚拟主播能持续的去做运营 , 相当于值班 。 第二个 , 主播没有办法随时应答的时候 , 虚拟主播可以随时和粉丝互动 , 以及做直播内容里面脚本的制作 。 它其实是一个辅助和提效的作用 。 虚拟主播出来之后 , 其实会让主播之间专业性的PK变得更多 。
今天平台上做了很多努力 , 其实不局限在虚拟主播 。 我在介绍的时候特别去讲虚拟主播 , 是因为我们觉得当下这个节点 , 主播的运营能力是需要去提升的 , 与此同时我们也希望通过这种技术给消费者带来更强的体感 。
实际上整个直播过程里面所涉及的环节有很多方面 , 在选品上面 , 我的粉丝到底是喜欢的是哪些品牌 , 它到底是一个怎样的人群 , 都会有差异化的 , 所以我们再去根据这种差异化提供服务 。
Q:淘宝直播未来的规划?
岱妍:淘宝直播马上5年了 , 我们一直没有改变过我们的定位 , 就是“有趣、有用、有料”这6个字 。
“有趣” , 就是让消费者和主播和商家之间产生互动 , 甚至是消费者和消费者之间能够去产生关系和互动 。 “电商直播”说的是直播 , 直播就是实时的互动 , 不管是从互动的玩法 , 还是我们提供的一些互动的服务 , 这个肯定是必不可少的一个关键词 。
其次我们本身是电商直播 , 生活消费类的直播平台 。 今天 , 电商能力如何和直播产生有效的衔接?我们今年有六成成交是来自于我们的商家 , 今天怎么把商家的运营路线和直播去做结合 , 让直播和店铺合二为一 , 直播能力是我们的核心发力点 。 这也是有趣 。
有用 , 指的是我们要在内容上面做更专业更精准的服务 , 同时服务好商家和消费者 。 到底怎么样讲解内容 , 能满足我们的消费者的诉求 , 能让主播在讲解的过程中 , 更精准更高效 , 这是我们在后端链路上面 , 数据服务上面 , 包括在整个算法和技术的理解上面 , 要去做的突破 。
有料是什么?为了让粉丝更愿意看直播 , 让规模得到更大提升 , 我们会去搭不同的场 , 让直播和消费者建立关系的通道做的更宽 。
【电商在线|淘宝直播首次完整展现核心秘密:5年前布局技术,达摩院加持】整个淘宝直播其实不仅仅在手淘内 , 还在支付宝、微博、uc、优酷 , 包括我们三方的联盟生态 。 合作下来 , 阿里内外经济体 , 已经有将近百家的落地场景了 , 所以在这个里面能把更有效的更好玩的内容和各个场景去做好衔接 , 怎么把真正的生活场景和消费者场景能做融合 , 把合适的内容推到各个不同的合适的场景环境 , 能够降低我们商家的运营风险 , 能够拓宽到我们的经济地位 , 能让消费者接受环保直播 , 从手淘能扩散到我们的经营平台 , 这是我们要去不断去深耕的 。