『InfoQ』8 亿用户的网易云音乐是怎样建设数据中台的?


作者 | 万佳
嘉宾 | 朱一飞
这几年 , “中台战略”概念像是一把火 , “烧遍”国内互联网 。 而在业界 , 关于中台的实践并不多 , 尤其是数据中台 。 何为数据中台?数据中台建设面临着哪些挑战?它会带来哪些收获?......
带着这些疑惑 , InfoQ 采访人员采访了 ArchSummit 全球架构师峰会讲师网易云音乐数据智能部数据开发专家朱一飞 。 作为国内知名音乐平台 , 网易云音乐有 8 亿用户 。 不过 , 它面临的挑战在于 , 一方面各个业务单元在 8 亿用户基数上积累海量的数据 , 另一方面 , 业务部门基于发展需要提出大量数据需求 , 并且在数据质量、数据共享、实时化方面的要求越来越高 。 为解决这些问题 , 网易云音乐搭建了自己的数据中台体系 , 且受益匪浅 。
2012 年加入网易云音乐初创团队 , 朱一飞是一名“土生土长”的网易云音乐技术人 。 随着公司不断发展 , 他先后负责过搜索、音频识别后端架构 。 2016 年 , 朱一飞开始带领数据团队 , 经历了数据团队业务组建到平台建设 , 再到近一两年推进中台体系建设 。
1
何为数据中台?
虽然当前关于中台的讨论已经很火热 , 但朱一飞认为数据中台是以数据驱动业务创新为目标 , 具备灵活机动快速反应特征的技术与组织能力体系建设 。 这里面有三个基本元素:
目标 。 中台的最终目的是解决业务问题;
灵活快速 。 能不能快速解决业务诉求是衡量数据中台的重要标准 。 说到底 , 建设中台是为了用;
体系化 。 n 支游击队凑在一起成不了集团军 , 因而缺乏强大的战斗力 。 关于技术体系、组织架构 , 需要有完整、严谨和深入的思考 。
2
数据中台建设的背景和诉求
据悉 , 网易云音乐的数据团队最初是一支业务开发团队 , 其大部分工作都在解决业务需求 。 后来 , 团队慢慢发现平台工具层面存在诸多瓶颈 。 因此 , 团队发起为期 2 年左右的平台化建设 , 基本搭建起底层的技术基础设施 。
在朱一飞看来 , 随着网易云音乐的创新发展 , 尤其是产品矩阵建立后 , 如何快速完整地满足业务对数据的诉求依然有很大的提升空间 。
“除底层工具建设外 , 我们发现还需要在平台与业务中间“铺设”一个中间层 , 确保团队能理解业务目标而不是躲在后台的技术领域自娱自乐 。 同时 , 我们还要快速跟上各产品发展方向的变化 , 并且努力将试错成本降到最低 。 因此 , 我们反过来又去思考平台体系还有哪些不完备的地方 , 组织架构还需要进行哪些调整 。 ”他说 。
而团队对于数据中台建设的诉求 , 主要分为两部分:
一是面向过去看要解决的问题 , 其中的核心是整个数据链路的标准化(包括方法论和工具两个层面 , 细化到链路的各个环节有不同的具体目标) , 以及如何去推动这套标准在所有相关业务团队的落地 。
二是面向未来要为业务提供什么样的驱动力 。 团队要以什么样的形式提供数据服务 , 以及团队应该是什么样的组织模式 , 从而跟业务团队保持高效协同 。
3
面临的挑战
据朱一飞介绍 , 团队面临的挑战是在业务需求响应与体系建设上如何取得更好的平衡 。 “解决单一问题总是相对简单的 , 相信很多兄弟团队都深有体会” 。
他表示 , “虽然目前网易云音乐的数据中台建设取得一定进展 , 但我们还是认为长期处在中台建设的’初级阶段‘ 。 ”
在整个数据中台建设中 , 他们需要不断做出权衡(trade off):
主干问题优先 , 考虑 ROI , 比如数仓标准化、埋点规范化、指标口径统一等问题如果在产品初期不落地 , 则积重难返 , 而且大大消耗团队的精力 。 所以 , 这类问题 , 他们一般会在新产品场景优先去落地 。
业务核心项目优先 。 核心的业务项目(比如云音乐中的增长项目)其实是中台服务的触点 , 如果错过了 , 以后合作接入就困难重重 。 因此 , 这类项目 , 他们一定会想办法先推动落地 , 再去考虑后续优化 , 体系化改造 。