关于【双鱼女一般男生征服不了】 , 征服双鱼女最直接办法 , 今天向乾小编给您分享一下 , 假如对您有所帮助别忘了关注本站哦 。
内容导航:1、拿来就能用!Python 天天定时发送一句情话 | 原力计划2、双鱼女一般男生征服不了:征服双鱼女最直接办法1、拿来就能用!Python 天天定时发送一句情话 | 原力计划作者 | Baldwin_KeepMind
出品 | CSDN博客
我的日记 4月23日 晴你三天没回我的消息 , 在我孜孜不倦地骚扰下你终于舍得回我了 , 你说‘nmsl’我想这一定是有什么含义吧!噢!我恍然大悟 , 原来是尼美舒利颗粒 。她知道我关节炎 , 让我吃尼美舒利颗粒 , 她还是关心我的但是又不想显现的那么热情的 。天啊!她好高冷 , 我似乎更喜欢她了呢!你看 , 虽然女神常常不理我 , 但是还是会偷偷地关心我 , 虽然她不直说 , 但是我都懂 。
唯一的问题就是 , 我最近很忙 , 忙到都没有时间去给女神发“早安”了 。不可以!“早安”绝对不能断 , 这是我对女神诚挚的爱 , 女神虽然不会回复我 , 但是她肯定都记在心里 , 不回复我肯定是在考验我!
作为一名无所不能的程序猿 , 我马上就想到为什么不用Python爬取情话 , 然后天天定时发送给她呢?
爬取情话
选取情话资源
首先我们需要去网上找到合适的情话资源 , 假如懒得自己找 , 可以用这个:http://www.1juzi.com/new/150542.html
分析网页资源
1. 定位情话资源
鼠标放在我们要爬取的情话上快速按下右键+检查(元素) 。
先在就可以看到我们的情话在页面中是什么位置了 。
2. 定位标签
在开发者工具中 , 我们轻松的旧定位到了我们的情话的标签 , 就是上图红框里的内容 。
3. 分析哀求方式
在刚才的界面(不要退出开发者模式)下刷新:
在Network栏目下找到我们哀求的那个资源 , 在他的Headers中找到这个资源哀求的方式 , 这里是GET 。
使用urllib库获取资源
1、安装urllib库
这一步是怕你服务器里没有urllib2库 , 等会儿会造成麻烦才添加上的 , 假如你没有添加该库 , 请百度添加方法 。
2、哀求资源网站
代码:
import urllib.requesturl = "http://www.1juzi.com/new/150542.html"html = urllib.request.urlopen(url).readprint(html)结果:
......h1??ììò???D??é?°/h1divdivscript type="text/javascript"news1;/script/divp1?¢????·????òD?à?×???òaμ?????£?ó?D?à′?ì??μ???×??£/pp2?¢°?ê?ì¤??oì3?í?′?????£?°?ê?ò?éúò?êàú¤ú¤????£?°???£??ò2??êàíóé?£/pp3?¢ק??è??3£?óè??ò?êà?à°é£?óμ??è??3£??¤??ò?êà??°2?£/pp4?¢o??1ê?ò°D?£??ò?¤?±á?ò?±2×óμ?????£?′óó??????aê?£?2?????íá2??àD??£/pp5?¢?òoóà′??á???£??ò2?μ¢?ó??£??1?áóD±eè?μ¢?ó??£????ò2??êD?£??1ê??òà′μ¢?ó??°é?£/pp6?¢??μ???μ???ò??ì?ò?í2??a?ù′?£?óDμ???ê?μ?D?ì?£?ê?????±?á??ò£?ò??°?ò′ó2??á?a?ùμ??£?ùè?óDò???è??üè??òD??ê?é??μ???±????íê????£/pp7?¢???òμ??é?é?÷à?è¥?′o£2?òa?′à′??òa??à′?£/pp8?¢??ò?ìì???a??D?ì?£???ò??ì??±????D?ˉ£???ò??????a??μ£D??£óD??μ??D????o??£/pp9?¢2??ò?ùìy?é?è£?μ±?ò??è?£?òò?a??àá?12?×??£/p......小问号 , 你是否有很多朋友?
我们爬下来的都是乱码 , 发给女神一堆乱码 , 女神可能还会以为是我们给她发的暗语 , 说不定还要花时间去寻找解密方法 , 想想都累 , 不能这个样子!
其实出现乱码的原因主要网页的编码方式和我们爬取程序的编码方式不一样造成的 , 只要找到网页的编码方式就好 。
3、设置解码类型
有3种方式:
1.从网页Content-Type中获取编码方式
2.第三方库智能识别编码 , 常用chardet等
3.预测编码
我们这里其实在哀求头的Content-Type里有编码类型 , 但是为了保险起见 , 也是为了能应用到更多的资源网站 , 这里演示以下chardet的用法 , 预测编码的使用请自行百度 。
chardet获取编码类型
代码:
import urllib.requestimport chardeturl = "http://www.1juzi.com/new/150542.html"html = urllib.request.urlopen(url).readprint("html头中的charset:", chardet.detect(html))结果:
- 哪些物品不能放在车内?小心变成“不定时炸弹”
- 什么是碘盐?天天摄入多长碘最好?碘盐的作用
- 每天洗头有什么危害 天天洗头的危害在哪里
- 承受天天百万级访问量的网站需要多长台服务器?
- 健身3大误区
- 微信手持弹幕怎么玩 怎么发送给好友
- react切换路由的话怎么清除定时器react怎样跳转到另一个页面
- 2022-2023北京供暖天天晚上都要封火吗
- 2018年惊蛰是哪一天天气还会冷吗
- 2022-2023北京供暖天天几点到几点停止