|用户画像规划流程和方法


编辑导语:如今在这个大数据时代 , “用户画像”这个词经常出现 , 它跟精准营销挂钩 , 可以根据一个人的兴趣、地理位置等进行精确的推送 , 达到良好的营销效果;本文作者分享了关于用户画像规划的流程和方法 , 我们一起来看一下 。

|用户画像规划流程和方法
本文插图
互联网行业飞速的发展 , 带动行业业务量激增 , 同时伴随数据量的增加 , 互联网各行各业慢慢形成头部企业 , 2/8原则下长尾企业也越来越多;因此 , 在大数据量和激烈竞争下 , 如何更好的对产品进行营销 , 如何制定价格策略 , 越来越重要 。
那么 , 如何制定准确的营销和价格 , 就需要我们针对不同人群 , 不同个体的特点进行精细化推荐 , 所要本章介绍了如何进行用户画像 。
文章结构:

|用户画像规划流程和方法
本文插图
一、什么是用户画像
用户画像就是对用户按照一定的规则进行统计 , 划分 , 从而能够指导用户推荐 , 客户分层运营 , 达到营销效果 。
昨天:手机APP大爆发是随着手机硬件的发展而发展起来的 , 发展前期大量APP为抢占市场纷纷上线;用户画像只是为了指导产品设计 , 主要用于产品设计前夕的用户访谈、用户调研的前期工作 , 而且一般覆盖的人群比较狭隘 , 精准度差 , 产品经理设计产品全靠感觉 。
今天:行业竞争越来越大 , 行业产生的数据量也越来越大 , 各大公司开始建造自己的数据仓库;那么如何应用数据仓库中的数据 , 如何进行精细化运营 , 用户画像越来越受到重视 。
明天:随着大数据技术的成熟应用 , 用户画像标签将越来越多 , 目前互联网行业中比较成功的标签系统是淘宝的千人千面 , 技术创新必将推动用户画像的精准度 。
二、用户画像常用场景
用户画像概况可应用于一下三个场景:

  • 产品设计:开发前期的产品定位设计;
  • 产品营销:指导运营对特定用户进行推送活动信息 , 推广信息 , 个性化推荐等 。
  • 产品决策:分析用户画像统计对产品的发展现状和发展趋势进行预测 , 及时调整产品发展路线 。
按照用户标签的生产方式可分为:
统计标签:现有的可以直接从数据中提取出来的标签;包括用户自然属性 , 用户行为统计等信息 。
规则标签:自定义规则进行标签建模;根据业务流程提取需要统计的标签 。
算法模型标签:根据机器学习等算法进行用户行为预测分类;具有不确定性、开发周期长、成本高 , 因此系统中此类标签数量较少 。
三、用户画像系统搭建流程
1. 数据采集
对用户数据进行采集 , 数据预处理 , 数据挖掘和过滤等手段得出期望的数据集 。
用户数据一般分为埋点数据和业务数据:
  • 埋点数据:根据用户的行为特征进行埋点 , 将得到的数据进行处理存储;
  • 业务数据:用户的姓名、年龄、地理位置等自然属性 , 同时包括用户购买、用户评价、用户评论等隐形数据 。
具体采集方法可以使用如下算法模型:
【|用户画像规划流程和方法】文本挖掘模型(TF-IDF):处理文本类型 , 提取数据信息 。
TF是词频 , IDF是逆向文件频率 , TF-IDF是词频和逆向文件频率的乘积 。
Nij就是词i在j文章中出现的次数 , 分母就是文章的总词数 。
D就是语料库中文件总数 , 下面分母就是词i出现的文档数 , 然后取对数 。
该算法可以直接调用python库Sklearn进行实现 , 但是该算法比较单一 , 不考虑词条在文章中的位置 , 不能准确描述词的重要程度 , 一般需要结合其他其他算法或者增加权重改进 。分页标题
聚类算法:聚类算法较多 , 如ANN神经网络和贝叶斯等 , 聚类主要是针对冷启动用户、用户分群营销等目的;具体算法相对复杂 , 目前算法应用多使用python的各种库如Sklearn , 包括一些框架tensorflow、caffe等 。
相似度模型:一般使用相似度模型进行辅助用户分群 , 常用的有逻辑回归、线性回归、余弦相似度、皮尔森相似度等 。
具体说下余弦相似度:

|用户画像规划流程和方法
本文插图
实例:

|用户画像规划流程和方法
本文插图
用户1和用户2通过公式计算相似度为0.945406 , 是不是可以解释为两个用户可以划分为同一类人 , 进行用户分群(计算过程只是用于解释算法 , 无其他意义) 。
若已有数据仓库 , 数据采集相对比较轻松 , 可参考文章“每日优鲜如何搭建数据仓库?” 。
2. 用户维度分析
用户分析具有多维度 , 随时间更新的特点 , 包括用户年纪、学历、兴趣、消费水平等都容易变化 。
因此维度信息应该随着用户偏好发生变化 , 因此 , 在标签系统中需要有新增标签功能 。

|用户画像规划流程和方法
本文插图
3. 维度标签化
用户画像最终的实现应该是对维度进行标签化 , 常用MECE法则进行标签化 , 防止标签界限不清晰 。
标签需要根据需要进行逐级拆分 , 例如:

|用户画像规划流程和方法
本文插图
4. 标签映射 , 接口封装
用户画像数据导入服务器中 , 为后续推荐系统 , 营销活动服务;封装成API可以作为数据服务的内容 , 对其他系统提供数据支持 。
5. 用户画像评估
对画像进行评估:
用户覆盖率:用户画像具体能够覆盖到多少用户 , 有些用户画像可能覆盖总用户的50%或者80%;所以覆盖率是用户画像应用的一个评价 , 覆盖率越高 , 对后续精准营销的策略选择越准确 。
准确率:模型的准确性 , 如上所述 , 使用算法模型导致的用户分群错误或者对用户的购买意向预测错误 , 将直接影响购买率 , 影响GMV 。
可拓展:用户画像在维度刻画应该是可扩展的 。
及时性:如果用户画像服务到实时推荐系统中还需要用户画像的及时 。
四、总结
用户画像结合大数据技术使用户刻画更加细致、及时 , 对日趋竞争激烈的互联网浪潮起到越来越重要应用 。
本文由@汪仔2296 原创发布于人人都是产品经理 , 未经许可 , 禁止转载 。
题图来自Unsplash, 基于CC0协议