用python进行办公自动化都需要学习什么知识( 二 )


在一些企业招分析师的笔试题中 , pandas已经作为必考的工具 , 所以如果你想要入行数据分析师 , 请努力学习使用pandas 。
numpy是python的数值计算库 , 包括pandas之类的很多分析库都建立在numpy基础上 。
numpy的核心功能包括:
ndarray , 一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组
用于对整组数据进行快速运算的标准数学函数(无需编写循环)
用于读写磁盘数据的工具以及用于操作内存映射文件的工具
线性代数、随机数生成以及傅里叶变换功能
用于集成由C、C++、Fortran等语言编写的代码的A C API
numpy之于数值计算特别重要是因为它可以高效处理大数组的数据 。 这是因为:
比起Python的内置序列 , numpy数组使用的内存更少
numpy可以在整个数组上执行复杂的计算 , 而不需要Python的for循环
matplotlib和seaborn是python主要的可视化工具 , 建议大家都去学学 , 数据的展现和数据分析同样重要 。
sklearn和keras , sklearn是python机器学库 , 涵盖了大部分机器学习模型 。 keras是深度学习库 , 它包含高效的数值库Theano和TensorFlow 。
这些是大家耳熟能详的神库 , 非常推荐去学习 。
关于数据分析 , 推荐一本经典书籍:
广告
利用Python进行数据分析(原书第2版)
作者:[美]韦斯·麦金尼(Wes,McKinney)
京东
自动化爬虫
相信爬虫是大家最感兴趣的 , python爬虫有很多的实现库 , 比如:urllib、requests、scrapy等 , 以及xpath、beautifulsoup等解析库 。
爬虫入门容易 , 但学精难 , 所以初学者可以尝试写点简单的爬虫 , 比如豆瓣、知乎、微博呀 。
这方面我们过去的案例都很多 , 这里给几篇工具介绍:
requests库 , 让你的爬虫开发效率提升8倍
chrome开发者工具 , 掌握它就解决了一半的问题
网页解析工具 BeautifulSoup4 介绍
推荐大家去学习requests、bs4来入门爬虫 , 官方中文学习网站:
其它
其它不常用的自动化办公库 , 像处理pdf、图片、视音频等 , 这里不做过多介绍 。
【用python进行办公自动化都需要学习什么知识】如果有兴趣可以在本文末留言:你用过哪些逆天的python库 , 解决了哪些问题?
用python进行办公自动化都需要学习什么知识文章插图