数据统计口径是什么意思 数据统计口径是什么意思( 七 )


分析阶段的4个陷阱
终于到了直接创造价值的部分了!前面三个步骤 , 十二个陷阱 , 通常会占据数据分析工作80%以上的工作量 , 但大家感受不到他们的价值 。那些工作的价值几乎都是隐性的 , 没有他们做基础 , 万万不能 。但让那些付出产生回报的分析里 , 却藏着4个是最容易让数据变成谎言的陷阱 。
陷阱十三:不剔除假流量就做数据分析 。
近5年 , 在线广告的假流量占比持续降低 , 但平均下来占比也高达30% , 虽然假流量的比例在逐年下降 , 但即使是最乐观的估算2020年这个占比也能到四分之一 。而某些重灾区 , 这个数字甚至会超过50% , 更有甚者超过80% 。
这么大的比例 , 不剔除出去 , 数据分析还有什么意义!
为什么会有这么大的比例呢?
首先 , 造假的直接成本太低 。机器人假流量的直接成本很低 , 是真流量的千分之一!即使是那种技术含量很高 , 很难识别的机器人假流量 , 直接成本也不到真流量的百分之一 。而“肉鸡”则更难识别 , 且直接成为也不到真流量的五十分之一 。利润太大了 , 总是有人抵抗不住这种诱惑的 。
其次 , 广告主买到假流量仍赚钱就没事 。我们拿最夸张的80%举例 , 只要这20%的真流量带来的收益 , 比广告投放成本高 , 广告主就没必要较真 , 当做流量的真实价格是标价的5倍就好 。除非有另一平台 , 带来的收益更高 , 那即使假流量更大 , 广告主也会考虑换到那里 。
再次 , 实锤假流量很难 。造假技术也是在不断升级的 , 能升级到什么程度呢?《猫鼠游戏》里有段台词说得好:“技术上来讲 , 他不是在做假支票 , 就是在做真支票 。”有些假流量高级到 , 除了没有付款 , 所以你怀疑它是假流量外 , 你找不到任何证据 。
最后 , 假流量是个巨大的利益集团……点到为止!点到为止!
如何应对假流量呢?
1) 我很想教大家如何识别假流量 , 但曾经我用某种方法 , 证明了1个渠道是假流量 , 对方不接茬了 。结果下次 , 相同的方法无法证明这个渠道是假流量了 , 但转化毫无提升 , 我怀疑还是假流量 , 又费了很大力气才实锤就是假流量 。这就很尴尬了 , 我实锤吧 , 这招下次就不好使了 , 我不实锤吧 , 就得看着他们继续作孽 。所以 , 有机会线下和大家细说 , 这里只分享一个方法 , 比如分辨率的宽连号从1300-1399 , 100个数字全都有 , 且流量占比相同 , 最重要的是分辨率的高都是0 。挺玄幻是吧 , 还有更玄幻的呢 。找多了假流量你会发现 , 真的很有趣 , 点到为止哈!
2) 有些你严重怀疑是假流量 , 但没有上面那么明确的证据该怎么办呢?反正他是不会有转化 , 不会有付款的 , 把它当成低质量流量处理就好了 。
3) 一个渠道真假流量混合怎么办?根据实锤证据把假流量筛出去 , 再分析 。
陷阱十四:不对指标细分 , 不加其他相关指标验证 。
总说在线业务的例子 , 很枯燥 , 这里换个篮球场上数据分析的例子 。
有个球员 , 新赛季投篮命中率55.7% , 上赛季投篮命中率48.7% , 提升了7个百分点 , 那我们是不是就可以认为 , 他们投篮更准了呢?命中率更高和投篮更准是一回事吗?听起来像是一回事哈 , 数据支持这种想法吗?
我们把投篮区域分成:篮下、中投和三分 , 细分看看数据是什么情况 。
上赛季
本赛季
三分
33.3%
27.8%
中投
37.5%
36.7%
篮下
71.4%
71.0%
合计
48.7%
55.7%
惊不惊喜!
意不意外!
这是开了什么挂?!篮下、中投和三分和上赛季比都下降了 , 但合计命中率居然上升了!
我们加入按投篮区域细分命中/出手数据 , 再看下:
上赛季
本赛季
命中率
命中/出手
命中率
命中/出手