工作中经常会遇到一些每天都要进行的重复操作,没一点技术含量,做起来却费时费力,还时不时出点小错。为应对这种情况,有些人会用VBA进行处理。但编辑了VBA功能的文件通用性不好,遇到领导、同事的excel未开启宏,就用不了。其实,用Python处理excel数据,比VBA更高效,而且还简单。我们来看看如何用Python处理excel数据:

一、Python处理Excel的方式

python对excel的操作是通过导入相应的功能库,然后利用库里的模块写代码实现的。与excel有关的库一般包括:xlrd、xlwt、xlutils、openpyxl、xlsxwriter,这五个库用法各异,综合来说,优先推荐opengyxl,不建议全部导入有备无患的想法。各库功能用法说明如下:

1、xlrd:读取excel文件的库

导入后,执行对excel文件打开、读取数据操作。比如:

import xlrd # 导入xlrd库
wb = xlrd.open_workbook(r"e:\test.xls")
sht = wb.sheets()[0]
aa = sht.name
bb = sht.cell_value(1, 1)
print(aa, bb)

代码解析:

1、导入xlrd库

2、打开e:\test.xls文件,wb代表该打开的工作薄

3、sht代表wb工作薄里第一个表单

4、aa代表sht表单的表单名

5、bb代表sht表单里第2行第2列单元格的值

6、在终端输出aa、bb,检验运行效果。

此时,若想修改bb单元格的值,是不可以的,因为导入的xlrd库只支持读取,不支持写入、修改。

2、xlwt:向excel表格写入数据的库

导入后,执行创建新表格,写入数据操作,比如:

import xlwt
wb = xlwt.Workbook()
sht = wb.add_sheet("表1")
sht.write(0, 0, '测试数据')
wb.save(r"e:\python\创建表.xls")

代码解析:

1、导入xlwt库

2、wb代表刚创建的工作薄

3、sht代表在wb工作薄中创建表单,表单名为“表1”

4、在sht表单中的a1单元格写入“测试数据”

5、保存工作薄路径及文件名为:“e:\python\创建表.xls”

3、xlutils:修改excel文件的库

导入后,执行打开既有excel表格数据的修改等操作,比如:

import xlrd
import xlutils as cp
wb = xlrd.open_workbook(r"e:\test.xls")
aa = cp.copy.copy(wb)
sht = aa.get_sheet(0)
sht.write(1, 1, "xxx")
aa.save(r"e:\test.xls")

代码解析:

1、2、导入xlrd库和xlutils库

3、打开"e:\test.xls"文件

4、aa代表复制刚才打开的文件

5、sht代表复制的文件第一个表单

6、向sht表单第2行第2列写入“XXX”

7、还是用原名保存文件,完成文件内容的修改。

以上三个库第一次使用时可能会提示报错:

python如何定位多个excel单元格 python处理多个excel表_表单


这是因为系统里没有对应的xlrd库造成的,我们用pip方式先给系统里安装库:打开cmd命令,输入

pip install xlrd

python如何定位多个excel单元格 python处理多个excel表_开发语言_02


回车,开始安装。稍等片刻,出现下面的界面即完成安装:

python如何定位多个excel单元格 python处理多个excel表_Python_03


再回到vscode界面,提示已经没问题了。

python如何定位多个excel单元格 python处理多个excel表_Python_04


同理,通过pip install xlwt,ipip install xlutils完成xlwt库和xlutils库的导入,就可以放心使用了。

以上库存在的不足:

1、三个库分别有各自的功能,一般需要同时使用才能满足实际使用,用起来比较麻烦。

2,xlwt库和xlutils库写入和修改操作,都只能保存为.xls格式,若保存为.xlsx格式,则打开文件时会提示格式错误。

3、写入操作后,未保存文件时读取不到刚写入的数据,读取的还是未写入之前的数据,只有保存后在读取才能得到正确结果。

4、openpyxl库

用opengyxl库操作excel,则能轻松解决上面三个库的不足,且代码更符合excel使用习惯。

import openpyxl
wb = openpyxl.load_workbook("e:\dest.xlsx")
sht = wb['sy']
print(sht['a2'].value)
sht['a2'].value = "新名字"
print(sht['a2'].value)
wb.save("e:\dest.xlsx")

代码解析:

1、导入openpyxl库

2、打开e:\test.xls文件,wb代表该打开的工作薄

3、sht代表wb工作薄里名字为sy的表单

4、读取输出sht表单a2单元格的内容

5、给sht表单a2单元格写入数据“新名字”

6、再次读取输出sht表单a2单元格的内容,会发现本次输出的就是刚才写入的"新名字"

7、保存文件,不更改文件名。

不足之处:不能操作.xls文件。

5、xlsxwriter库:可在excel文件里写入并设置图表的库,有图表要求的,后期专题学习。

6、com调用Excel的API库:通过COM调用,实现Python对excel操作的方法,写法与VBA非常相似,个人认为还不如python的openpyxl好用,且设置过程相对复杂,以后有机会再介绍。

理论结合实际,我们用一个真实案例来体验一下python处理excel数据的感觉:

文件“删除最小值.xlsx”中,(A:D)四列数据,希望删除每行的最小值,保留三个值,写入到后面(F:H)列中。

python如何定位多个excel单元格 python处理多个excel表_后端_05


1、导入openpyxl库来处理:

import openpyxl

2、打开文件,定义表单:

wb = openpyxl.load_workbook("e:\删除最小值.xlsx")
sht = wb['数据']

3、数据处理(请自动忽略粗糙的逻辑思路)

for i in range(2, 8):
 minnum = sht.cell(i,1).value
 if sht.cell(i, 2).value < minnum:
 minnum = sht.cell(i,2).value
 if sht.cell(i,3).value < minnum:
 minnum = sht.cell(i,3).value
 if sht.cell(i, 4).value < minnum:
 minnum = sht.cell(i, 4).value
 k = 0
 for j in range(1, 5):
 if sht.cell(i, j).value > minnum:
 k += 1
 sht.cell(i, k+5).value = sht.cell(i, j).value
 print(sht.cell(i, k+5).value, end=' ')
 print()

4、保存文件:

wb.save("e:\python\删除最小值.xlsx")

运行后通过print代码在终端显示了结果:

python如何定位多个excel单元格 python处理多个excel表_表单_06

打开表格,数据已经完成了填入:

python如何定位多个excel单元格 python处理多个excel表_表单_07

总结:

总的来说,用openpyxl库让python处理excel还是比较容易的,符合python容易上手的特点,让大家把精力多放在问题解决思路上,而不是浪费在学习代码写法规则上。