Python对Excel进行处理
目录
xlrd、xlwt和openpyxl模块的比较:
一、xlrd:对xls、xlsx文件进行读操作
二、xlwt:对xls文件进行写操作
三、openpyxl:
1、对xlsx文件进行写操作
2、openpyxl:对xlsx文件进行读操作
xlrd、xlwt和openpyxl模块的比较:
区别:
模块 | Excel格式支持 | |
xls | xlsx | |
xlrd | √ | √ |
xlwt | √ | × |
openpyxl | × | √ |
效率:
两种包对小文件的读写速度差别不大,而面对较大文件,xlrd/xlwt速度明显优于openpyxl,但因为xlwt无法生成xlsx是个硬伤,所以想要尽量提高效率又不影响结果时,可以考虑用xlrd读取,用openpyxl写入。
一、xlrd:对xls、xlsx文件进行读操作
1.获取工作簿对象:xlrd.open_workbook()
workBook = xlrd.open_workbook(filemname):打开Excel文件读取数据
注:filemname为文件名以及路径,如果路径或者文件名有中文给前面加一个r表示原生字符。
import xlrd
filename=r'D:\记录表.xls'
workBook=xlrd.open_workbook(filename)
2.获取工作表(sheet)对象
1)获取所有sheet页的名字,返回一个列表
workBook.sheet_names()
2)根据sheet页的名字获取指定表名的表,返回的是一个对象
sheetName = workBook.sheet_by_name(‘sheet1’)
3)根据sheet索引获取对应sheet表(索引是从0开始的),返回的是一个对象
sheetName = workbook.sheet_by_index(0)
3.获取sheet的名称:name
sheetName.name
4.获取行数和列数:nrows、ncols
1)获取表格的总行数
sheetName.nrows
2)获取表格的总列数
sheetName.ncols
5.获取整行或整列的值(数组):row_values、col_values
rows = sheetName.row_values(0) # 获取第一行内容,返回一个列表
cols = sheetName.col_values(0) # 获取第一列内容,返回一个列表
6.获取指定单元格的值:cell(a,b).value、row(1)[0].value
sheetName.cell(1,0).value # 获取第2行第一列的单元格数据
sheetName.row(1)[0].value # 获取第2行第一列的单元格数据
7.获取单元格内容的数据类型:ctype
sheetName.cell(1,0).ctype
注:返回为代表数据类型的值,编码分别代表:ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
二、xlwt:对xls文件进行写操作
1.新建工作簿:xlwt.Workbook()
workBook = xlwt.Workbook()
2.在工作簿中新建sheet页:add_sheet()
table = workBook .add_sheet(‘Over’,cell_overwrite_ok=True) # 如果对同一单元格重复操作会发生overwrite Exception,cell_overwrite_ok为可覆盖
sheet = workBook .add_sheet(sheet_name) # 新增sheet表
import xlwt
wb=xlwt.Workbook(encoding='utf-8') # 创建一个工作薄
sheet=wb.add_sheet('文件阅读记录信息表') # 创建一个工作表
3.向表格中写入数据:write(i,j,value)
sheet.write(i,j,value) # 向单元格(i,j)写入数据value
4.保存工作簿:save()
workBook.save(path)
三、openpyxl:
1、对xlsx文件进行写操作
1).新建工作簿:openpyxl.Workbook()
workBook = openpyxl.Workbook() # 新建工作簿
2).在工作簿中新建sheet页:create_sheet()
sheet = workBook .create_sheet(sheet_name) # 新增sheet表:sheet_name
3).向表格中写入数据:cell(i,j,value) --索引从1计数
sheet= workBook .active # 获得当前活跃的工作页,默认为第一个工作页
sheet.cell(i,j,value) # 向单元格(i,j)第i行第j列写入数据value
注意:行号和列号都从1开始计数,即(1,1)为第一行第一列
4).删除sheet表
sheet = workbook["Sheet2"]
workbook.remove(sheet )
5).保存工作簿:save()
workBook .save(path)
2、openpyxl:对xlsx文件进行读操作
1).获取工作簿对象:openpyxl.load_workbook()
workBook = openpyxl.load_workbook(filemname) # 读取xlsx文件
注:filemname为文件名以及路径,如果路径或者文件名有中文给前面加一个r表示原生字符。
2).获取工作表(sheet)对象
workBook.get_sheet_names() # 获取所有sheet页的名字(所有工作表名)
sheetName = workBook.get_sheet_by_name(‘sheet1’) # 根据sheet页的名字获取指定表名的表
sheetName = workBook.worksheets[0] # 根据sheet索引获取对应sheet表
3).获取sheet的名称:title
sheetName.title # 获取sheet的名称
4).获取行数和列数:max_row、max_column
sheetName.max_row # 获取表格的总行数
sheetName.max_column # 获取表格的总列数
5).获取整行或整列的值(数组):rows[i]、columns[i]
rows = sheetName.rows # 获取每一行内容,这是一个生成器,里面是每一行数据,每一行数据由一个元组类型包裹
cols = sheetName.columns # 获取每一列内容,同上
sheetName.rows[0] # 获取第一行内容–索引从0计数
sheetName.columns[0] # 获取第一列内容–索引从0计数
6).获取指定单元格的值:cell(a,b).value–索引从1计数
sheetName[‘A1’].value # 获取第1行第一(A)列的单元格数据
sheetName.cell(1,1).value # 获取第1行第一列的单元格数据
注:此处的行数和列数都是从1开始计数的,而在xlrd中是由0开始计数的