1.python处理Excel的几种方法:
方法一:利用pandas、
方法二、xlrd和xlwt两个模块分别用来读Excel和写Excel,只支持.xls和.xlsx格式,xlutils模块可以同时读写一个已存在的Excel文件,依赖于xlrd和xlwt
方法三、openpyxl(可读写excel表)专门处理Excel2007及以上版本产生的xlsx文件;2007一下的版本为xls结尾的文件,需要使用xlrd(读)和xlwt(写)库进行操作
当然还有其它包。
备注:
1、Python自带的csv模块可以处理.csv文件。
2、excel表的文字编码如果是"gb2312” 读取后就会显示乱码,请先转成Unicode
3、workbook: 工作簿,一个excel文件包含多个sheet。
4、sheet:工作表,一个workbook有多个,表名识别,如"sheet1”,"sheet2”等。
5、cell: 单元格,存储数据对象
6、Python读取Excel中单元格的内容返回的有5种类型,即sheet.cell(x,y)的ctype属性返回的是数值型:ctype : 0 empty,1 string,2 number, 3 date,4 boolean,5 error
2、用xlrd包读取Excel文件
用法示例:
#-*- coding: utf-8 -*-
importxlrd
file_path= "D:/MyData/ex_lizq5/PycharmProjects/read_excel/ratedate.xlsx"
#打开文件,获得excel文件的工作簿对象
excel = xlrd.open_workbook(file_path,encoding_override='utf-8')#返回所有的sheet对象的list
all_sheet = excel.sheets() #获得工作簿sheet对象的方法,得到一个sheet列表
print(all_sheet)#通过索引得到sheet对象
printexcel.sheet_by_index(0)#通过索引得到sheet对象的名称
printexcel.sheet_by_index(0).name#通过sheet表的表名获得对象
print excel.sheet_by_name("Sheet0").name#遍历sheet列表,对每一个sheet进行操作
for each_sheet inall_sheet:#从对象列表中获得sheet对象
printeach_sheet#获得sheet表的名字
print "sheet的名字是:%s".decode('utf-8') % each_sheet.name#格式化打印
print("表名称为:{0},类型为:{1}".format(excel.sheet_by_index(0), type(excel.sheet_by_index(0))))#获取工作表的基本信息,表名、行数,列数等
sheet_name =[]
row_num=[]
col_num=[]for each_sheet inall_sheet:
sheet_name.append(each_sheet.name)print "该excel文件共有%d个sheet,当前sheet的名称是%s,该sheet有%d行,%d列".decode('utf-8') %(len(all_sheet),each_sheet.name,each_sheet.nrows,each_sheet.ncols)
row_num.append(each_sheet.nrows)
col_num.append(each_sheet.ncols)printsheet_nameprintrow_numprintcol_num#遍历sheet1的所有行和列
print "--------------读取每行----------------------".decode('utf-8')#得到某个sheet的总行数
print excel.sheet_by_name('Sheet0').nrows#通过sheet的报名获得sheet对象
mysheet = excel.sheet_by_name('Sheet0')#每行形成一个列表
print "-----打印序号为1的行,结果是一个列表------"
print mysheet.row_values(1)#打印序号为1的行的第0列
print mysheet.row_values(1)[0]#遍历每行的值
for value in mysheet.row_values(1):printvalue,print ""
print "-----用row(index)方法打印,结果是一个字典列表-----"
#Sheet.row(r)或Sheet.col(c)可以获得指定行或列,返回Cell对象的list,得到的是一个字典列表
print mysheet.row(1)#获取单元格(1,1)的值
print mysheet.cell_value(1,1)
3、尽量不用xlwt包写入Excel文件
在xlwt中生成的xls文件最多能支持65536行数据,如果数据太多,会报这个错误:
ValueError: row index (65536)not an intin range(65536)错误
写入示例:
#1. 导入模块
importxlwtdefwrite_excel():#2. 创建Excel工作薄
myWorkbook =xlwt.Workbook()#3. 添加Excel工作表
mySheet = myWorkbook.add_sheet('A Test Sheet')#4. 写入数据
myStyle = xlwt.easyxf('font: name Times New Roman, color-index red, bold on', num_format_str='#,##0.00') #数据格式
mySheet.write(i, j, 1234.56, myStyle)
mySheet.write(2, 0, 1) #写入A3,数值等于1
mySheet.write(2, 1, 1) #写入B3,数值等于1
mySheet.write(2, 2, xlwt.Formula("A3+B3")) #写入C3,数值等于2(A3+B3)
#5. 保存
myWorkbook.save('excelFile.xls')if __name__ == '__main__':#写入Excel
write_excel();print ('写入成功')
4、用openpyxl包写入Excel文件
#导包
importopenpyxl#写excel
defwrite_excel():
f= openpyxl.Workbook() #创建工作簿
sheet1=f.create_sheet()#sheet1 = f.add_sheet(u'sheet1',cell_overwrite_ok=True) #创建sheet
row0 = [u'L1',u'L2',u'L3',u'L4',u'问题',u'答案']#生成第一行
#for i in range(len(row0)):
#sheet1.cell(column=i,row=0).value='L1')
#生成后续
for jkey inrange(len(newTables)):
jk= 1
for cT inrange(arrayNum):
jk= jkey + 1
if cT ==0:
sheet1.cell(row=jk,column=cT+1).value='1'
else:
sheet1.cell(row=jk,column=cT+1).value='2'f.save("chatPy.xlsx") #保存文件
if __name__ == '__main__':#写入Excel
write_excel();print ('写入成功')
5 用pandas读写excel
用pandas处理excel和csv文件方法相同