数据|这篇文章把数据讲透了(二):数据采集( 二 )


文章插图
优点:成本低,速度快,产品、市场等各部门均能参与;缺点:行为记录信息少,支持的分析方式少,减轻开发负担。
无埋点:用户展现UI界面元素时,平台会通过控件绑定触发事件,事件被触发的时候系统会有相应的接口让开发者处理这些行为;上传UI界面后,系统能够自动识别生成控件的唯一ID,ID是在程序内部生成,只需保证在不同的手机上面这些ID是一样的,就能实现用户端的无埋点数据获取。
数据|这篇文章把数据讲透了(二):数据采集
文章插图
优点:无需埋点,方便快捷;缺点:行为记录信息少,传输压力大。
网页端——网页爬虫(python,C…):
就具体语法而言,因为使用工具不同,并不能就具体语法提供指导(大家根据自己使用的语言,在CSDN上进行搜索),但其总体方法论是一致的。
方法论:人工确定爬取信息的维度→分析目标网站URL构成→确认爬取工具→编写程序语言→获取数据→保存于本地→后续进行数据挖掘。
三、结语本期,笔者通过一个“买菜”的例子,带着大家了解了数据采集的几种方式,相信大家有所收获!
下期,笔者讲在数据采集的基础上,为大家讲解如何利用常用工具进行数据清洗和数据清洗的几个维度!
本文由 @小陈同学ing. 原创发布于人人都是产品经理,未经作者许可,禁止转载。
数据|这篇文章把数据讲透了(二):数据采集】题图来自Unsplash,基于CC0协议。