当前python自动化越来越受到欢迎,python一度成为了加班族的福音。还有大部分人想利用python自动化来简化工作,不知道从何处下手,所以,这里整理了一下python自动化过程中的各种办公场景以及需要用到的python知识点。

Excel办公自动化

python 针对excel表格处理的非标准库应该是最多的,这也是把excel办公自动化放在第一个来说明的原因。

比较受欢迎的excel数据处理库主要是xlwings、xlsxwriter、xlrd、xlwt、pandas、xlsxwriter、win32com、xlutils、pandas等等。

PPT办公自动化

python关于ppt数据处理的非标准库主要是pywin32com、pptx,当然还有一些其他的,比较常用的还得是pptx。

word办公自动化

python操作word文档用到的非标准库主要是python-docx、pypiwin32、textract,最常用的是python-docx,需要注意的是textract库安装时需要安装一些其他的依赖就导致安装过程相对复杂一些,不像其他的非标准库直接使用pip install 进行安装。

数据处理与分析

目前在数据处理上面python主要提供了两个非标准库pandas、numpy都是比较受欢迎的。
pandas是一款不断进步的python数据科学库,它的数据结构十分适合做数据处理,并且pandas纳入了大量分析函数方法,以及常用统计学模型、可视化处理。numpy是python的数值计算库,包括pandas之类的很多分析库都建立在numpy基础上。

数据可视化

matplotlib和seaborn是python主要的可视化工具,不管多么好的数据处理最终都是要给用户展现的。所以数据可视化也是比较重要的一环,我经常用到的数据可视化的非标准库就是matplotlib,用起来还是比较舒服的。

数据提取自动化(爬虫)

关于爬虫涵盖的知识面还是比较广泛的,要想精通就得进行针对性学习.常见的爬虫非标准库主要有urllib、request、scrapy、bs4的网络数据爬取相关的库以beautifulsoup、xpath的网络数据解析库。

文件批量处理

关于文件的处理在python中提供了os内置库,不用进行额外的安装,导入使用就可以了。
通过os模块对文件进行一系列的操作,不过还得有一些python的编程基础才行呢。