批量处理EXCEL表格,进行指定内容的删除,并将修改后的结果按照原文件名进行命名
- 批量处理excel表格
- 表格导入
- 删除操作
- 另存为
批量处理excel表格
工作生活中我们难免要处理大量的excel表格,而且许多是大量的重复性工作,耗时耗力,针对批量处理excel表格,对表格内容进行修改删除等操作,运用python程序进行处理省时省力,还不容易出错。
表格导入
首先我们先引入os和pandas两个数据处理库。
// python
import os
import pandas as pd
// python
import os
import pandas as pd
代码正常运行,如果不报错就表示成功导入了这两个库
然后,我们读取文件夹里面的多个excel表格
name_list = os.listdir('C:/Users/GTY/Desktop/周二')
print(name_list)
大家可以用print语句进行读写,成功读出数据,则会出现excel表的表格名称,如下所示
['三年级阅读提升.xls', '五年级语文提升xls', '创意画社团1.xls', '动漫绘画社团1.xls']
接下来我们读取每部分excel表格的数据内容,这里执行一个for循环语句:
// python
for i in name_list:
df = pd.read_excel(r'C:/Users/GTY/Desktop/周二/' + i)
print('{}读取完成'.format(i))
print(df)
读取成功之后,用print语句进行打印,如下所示:
三年级阅读提升.xls读取完成
教学班名称 学生姓名 账号 班级
0 三年级阅读提升 张三 610928 三年级小学2020级1班
1 三年级阅读提升 李四 610113 三年级小学2020级1班
2 三年级阅读提升 李云龙 610122 三年级小学2020级1班
3 三年级阅读提升 石头 610429 三年级小学2020级1班
4 三年级阅读提升 和尚 610423 三年级小学2020级2班
5 三年级阅读提升 孙悟空 610525 三年级小学2020级2班
……
删除操作
随后,我们对列中含指定内容的行进行删除操作
// python
df = df[~df['学生姓名'].str.contains('张三|石头')## 该操作将‘info’列中包含有张三或者石头的行去掉;~是取反的意思,str.contains是将该列内容转化成字符串并查看包含括号中内容.
三年级阅读提升.xls读取完成
教学班名称 学生姓名 账号 班级
1 三年级阅读提升 李四 610113 三年级小学2020级1班
2 三年级阅读提升 李云龙 610122 三年级小学2020级1班
4 三年级阅读提升 和尚 610423 三年级小学2020级2班
5 三年级阅读提升 孙悟空 610525 三年级小学2020级2班
……
另存为
在完成删除操作之后,我们对操作之后的数据进行按照原来的excel表格进行保存并且存放在另外一个文件夹中,这样操作的好处在于在for循环里面读取一个excel数据,对该数据内的指定内容进行删除,保存,然后再进行下一个excel表格的操作,并且保证excel表格另存为之后与原来的excel表格的名称一致,不会乱码。
// python
info_marks = pd.DataFrame(df)
info_marks.to_excel('C:/Users/GTY/Desktop/周二改/{}.xlsx'.format(i))
最后在桌面的“周二改”这个文件夹里就会存放修改过后的excel表格。