傻大方


首页 > 人文 >

车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密

摘要:【车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密|Python|上海市|excel】下面我直接以FineBI为例,FineBI是国内知名度比较高的本土数据分析工具,比起tableau这些国外工具最大的优点就是简单、灵活,只需要用鼠标拖拽就能实现各种分析操作,基本不需要写代...



按关键词阅读:

车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密

文章图片

车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密

文章图片

车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密

文章图片

车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密

文章图片

车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密

文章图片

车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密

文章图片

车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密

文章图片

车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密

文章图片


听说最近车厘子的价格突然猛跌 , 之前很多人梦寐以求的“车厘子自由” , 现在都能实现了 。 其实车厘子的价格下降 , 主要原因是进口货运成本的大大降低 , 为了找到车厘子最佳的购买方式 , 我决定用python+BI进行数据分析 。
因此我在淘宝上用python爬取了3000条数据 , 然后导入到了FineBI中进行可视化分析 , 最终制作出了下面这样一份可视化报告:

下面我展示一下操作过程:
一、数据获取用Python在淘宝上进行数据爬取是老生常谈的操作了 , 直接在淘宝上搜索“车厘子” , 在下面的商品页中可以看到 , 我们这次主要爬取的标签是“商品名称”、“价格”、“付款人数”、“店铺名称”、“发货地址”等:

按下F12 , 调出后台查看源代码 , 找到不同的商品标签代码 , 比如价格是“price g_price g_price-highlight\">” , 付款人数是“deal-cnt”等:

了解了网页的代码结构之后 , 下一步就可以在python里直接编写代码了 , 具体过程不详细介绍了 , 部分代码如下:

爬取完数据之后导入到Excel里 , 然后在Excel里经过简单的数据清洗和处理 , 最终得到一份完成的数据表:

二、数据分析python虽然也能实现数据分析的功能 , 但是需要敲代码 , 学习成本和难度都比较大 , 不如直接利用专业的数据分析工具进行分析 , 比如常见的比如FineBI、Tableau、PowerBI等 。
下面我直接以FineBI为例 , FineBI是国内知名度比较高的本土数据分析工具 , 比起tableau这些国外工具最大的优点就是简单、灵活 , 只需要用鼠标拖拽就能实现各种分析操作 , 基本不需要写代码 , 对新手非常友好 。

其实FineBI本质上属于企业级的业务数据分析平台 , 除了数据分析之外 , 还能实现数据管理、数据平台搭建等功能 , 这里就不详细介绍了 , 大家感兴趣的话我下一篇再介绍 。
有了excel源表 , 首先我们将Excel导入到FineBI中:
【车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密】
然后直接点击页面左上角的“创建仪表板” , 就可以进入到可视化后台:

下一步进入到仪表板进行可视化操作 , 基本步骤是“选择图表类型——选择指标和维度——拖拽到指定坐标轴——美化细节” , 比如我想要创建一张可视化地图 , 首先要先选择图表类型为“区域地图” , 然后要选择指标和维度 , 但是原数据表里没有地理纬度 , 因此需要自己创建:

最后 , 我们再拖拽到指定坐标轴 , 然后美化细节就可以完成一张可视化地图了:

以此类推 , 其他的可视化图表也能够按照我们自己的需求进行制作 , 这里不详细讲了 。
三、数据可视化1、车厘子销量分布情况

可以看出来国内车厘子最大的销量来自上海 , 以及浙江、广东两省 , 西藏、青海、内蒙古等省份都没有销量 , 基本上来说沿海地区的销量要高于内陆 。
2、各省份销量情况

通过条形图就更明显了 , 上海的销量有20多万 , 几乎是浙江、广东、四川的总和 。
3、各城市的销量情况

筛选出了销量前十的城市 , 以及每个城市平均的车厘子价格 , 可以看出来上海的销量和价格都是最高的 , 可以看出上海的购买力有多强了;
4、车厘子的价格区间情况分页标题#e#

数据表里将价格区间分为“50以下”、“50-100”、“100-150”、“150-200”、“200-500”、“500以上”等 , 可以看出来占比最大的价格区间是“50-100” , 这应该属于平民价格了;值得注意的是“200-500”的价格占比也高于“100-150” 。
5、各门店的销量与价格情况


可以看出销量最高的基本都是旗舰店 , 最高的平均价格基本在600-800左右;
四、总结因为数据不算多 , 所以这次没有做太深的数据分析 , 大家可以自己拿数据 , 在FineBI里进行更多的分析 , 文中涉及到的工具和数据表 , 回个“车厘子”就能得到 。


    来源:(数据分析不是个事儿)

    【】网址:/a/2021/0221/kd726494.html

    标题:车厘子|Python+BI爬取3000条车厘子数据,发现了这些秘密


    上一篇:红米手机|拆解报告:RedmiWatch智能手表

    下一篇:摄像头|华为Mate50Pro概念图:屏下摄像头+直屏,“最美手机”不过如此!


    人文

    农业|安徽肥东:恢复生产 灾后自救

    阅读(35)

    受汛情影响,安徽省肥东县部分乡镇发生洪涝灾害,农业生产受到影响。为降低损失,当地乡镇在积极防汛的同时开展生产自救。新华社记者黄博涵摄...

    人文

    宝妈育儿微课|有种“新型尽孝”慢慢衍生,儿女觉得自己三观正,父母却偷偷抹泪

    阅读(26)

    孝敬老人是中华民族的传统美德,也是为人子女的责任与义务。但是在现实生活中,能够真正将这份美德发扬光大的人很少。当孩子们各自成家,赡养老人这件事反而成为了累赘,能够真心实意陪伴在父母身边的人非常少。01有种新型尽孝慢慢衍生,子女觉得自己三观正,...

    人文

    病例|安徽通报1例登革热病例 聊聊人类战蚊血泪史

    阅读(45)

    7月5日,安徽省广德市桃州镇万桂山社区一居民在安医附二院被确诊为登革热患者。央视新闻微博提醒广大网名:登革热传播途径为蚊虫叮咬,可防可控。居民如有发热、疲乏、恶心等症状请及时就诊。微博截图蚊子是地球上最残暴的屠夫,人类最大的天敌,与世界上的其...

    人文

    水上乐园|美了环境鼓了钱袋

    阅读(39)

    “好的环境不仅要打造,还要维护,在农村人居环境整治工作中,我们还采取门前三包责任制,让村民积极参与进来,形成工作合力,共同把简泉村打造成生态、美丽、和谐、富饶的乡村,吸引越来越多的游客前来观光旅游。乡村旅游发展好了,也会带动越来越多的乡亲们...