使用Excel电子表格

Excel是一款适用于Windows的流行和强大的电子表格应用程序。该openpyxl模块允许您的Python程序读取和修改Excel电子表格文件。例如,您可能会从一个电子表格中复制某些数据并将其粘贴到另一个电子表格中。或者,您可能需要经过数千行,并根据一些标准挑选出少数几行进行小编辑。或者,您可能需要查看数百个部门预算电子表格,搜索任何处于红色状态的电子表格。这些都是Python可以为你做的那种枯燥无味的电子表格任务。

安装openpyxl模块

Python不附带OpenPyXL,因此您必须安装它。

	pip install openpyxl

检查是否安装正确

	import openpyxl

OpenPyXL团队定期发布新版本,可能命令或者功能随时会有变动。不过,不要担心:新版本应该保持向后兼容本书中的说明相当长一段时间。如果你有一个更新的版本,并想知道你可以使用哪些附加功能,你可以在 http://openpyxl.redthedocs.org 查看OpenPyXL的完整文档。

下面介绍一下本模块的一些基本用法:

打开Excel文档

Excel自动为新工作簿提供的名为Sheet1,Sheet2和Sheet3的三个默认工作表的选项卡。(创建的默认工作表数量可能因操作系统和电子表格程序而异。)

使用OpenPyXL打开Excel文档: 一旦你导入了openpyxl模块,你就可以使用该openpyxl.load_workbook()功能。在交互式shell中输入以下内容:

	>>> import openpyxl 
	>>> wb = openpyxl.load_workbook('example.xlsx') 
	>>> type(wb) 
	<class'openpyxl.workbook.workbook.Workbook'>

该openpyxl.load_workbook()函数接受文件名并返回workbook数据类型的值。该Workbook对象表示Excel文件,有点像File对象表示打开的文本文件。 请记住,example.xlsx需要位于当前工作目录中才能使用它。您可以通过导入os和使用来找出当前工作目录是什么os.getcwd(),并且可以使用更改当前工作目录os.chdir()。

从工作簿获取表格

您可以通过调用该get_sheet_names()方法来获取工作簿中所有工作表名称的列表。在交互式shell中输入以下内容:

	>>> import openpyxl 
	>>> wb = openpyxl.load_workbook('example.xlsx') 
	>>> wb.sheetnames
	['Sheet1','Sheet2','Sheet3']
	>>> sheet = wb[r'Sheet1'] 
	>>> sheet
	<工作表“Sheet3”>
	>>> type(sheet)
	 <class'openpyxl.worksheet.worksheet.Worksheet'>
	>>> sheet.title
	“工作表Sheet 3”
	>>> anotherSheet = wb.active 
	>>> anotherSheet 
	<Worksheet“Sheet1”>

每个工作表由一个Worksheet对象表示,您可以通过将get_sheet_by_name()工作表名称字符串传递给工作簿方法来获取该对象。最后,您可以读取对象的active成员变量Workbook以获取工作簿的活动工作表。活动工作表是在Excel中打开工作簿时位于最上方的工作表。一旦你有了这个Worksheet对象,你可以从title属性中获得它的名字。

从表格中获取单元格

一旦你有一个Worksheet对象,你可以Cell通过它的名字来访问一个对象。在交互式shell中输入以下内容:

	>>> import openpyxl 
	>>> wb = openpyxl.load_workbook('example.xlsx') 
	>>> sheet = wb['Sheet1']
	>>> sheet ['A1'] 
	<Cell Sheet1.A1> 
	>> > sheet ['A1'].value 
	datetime.datetime(2015,4,5,13,34,2)

OpenPyXL将自动解释列A中的日期,并将它们作为datetime值返回而不是字符串。

	>>> c = sheet ['B1'] 
	>>> c.value
	'Apples' 
	>>> 'Row '+ str(c.row)+',Column'+ c.column +'is'+ c.value'Row 
	1,Column B is Apples' 
	>>> 'Cell'+ c.coordinate +'is'+ c .value 
	'Cell B1 is Apples' 
	>>> 表['C1']。值 
	73

该Cell对象只是一个字符串,不会包含存储在该单元格中的值。Cell对象也有row,column以及coordinate为单元提供位置信息的属性。 在这里,访问value我们Cell的单元格B1对象的属性给了我们字符串'Apples'。该row属性为我们提供了整数1,该column属性给我们'B',和coordinate属性给我们'B1'。

通过字母指定一个列可能会非常棘手,尤其是因为在列Z之后,列以两个字母开头:AA,AB,AC等等。作为替代方案,您还可以使用工作表的cell()方法获取单元格,并为其参数row和column关键字参数传递整数。第一行或列的整数是1,而不是0。通过输入以下内容继续交互式shell示例:

	>>> sheet.cell(row = 1,column = 2) 
	<Cell Sheet1.B1> 
	>>> sheet.cell(row = 1,column = 2).value
	'Apples' 
	>>> for i in range(1,8,2):
	>>> print(i,sheet.cell(row = i,column = 2).value) 
	1苹果
	3梨
	5苹果
	7草莓

在列字母和数字之间转换

要从字母转换为数字,请调用该openpyxl.utils.column_index_from_string()函数。要将数字转换为字母,请调用该openpyxl.utils.get_column_letter()函数。在交互式shell中输入以下内容:

	>>> import openpyxl 
	>>> from openpyxl.utils import get_column_letter,column_index_from_string 
	>>> get_column_letter(1) 
	'A' 
	>>> get_column_letter(2)
	'B' 
	>>> get_column_letter(27) 
	'AA' 
	>>> get_column_letter (900) 
	'AHP' 
	>>> wb = openpyxl.load_workbook('example.xlsx') 
	>>> sheet = wb['Sheet1']
	>>> get_column_letter(sheet.max_column) 
	'C' 
	>>> column_index_from_string ('A') 
	1 
	>>> column_index_from_string('AA') 
	27

从openpyxl.utils模块中导入这两个函数后,您可以调用get_column_letter()并传递一个像27这样的整数来确定第27列的字母名称。该函数会column_index_string()做相反的事情:您将它传递给列的字母名称,并告诉您该列的编号。您不需要加载工作簿即可使用这些功能。如果你愿意,你可以加载一个工作簿,获取一个Worksheet对象,并调用一个Worksheet对象方法max_column来获得一个整数。然后,您可以将该整数传递给get_column_letter()。

要访问特定行或列中单元格的值,还可以使用Worksheet对象rows和columns属性。在交互式shell中输入以下内容:

	>>> import openpyxl 
	>>> wb = openpyxl.load_workbook('example.xlsx') 
	>>> sheet = wb.active 
	>>> sheet.columns [1] 
	(<Cell Sheet1.B1>,<Cell Sheet1.B2 >,<Cell Sheet1.B3>,<Cell Sheet1.B4>,
	<Cell Sheet1.B5>,<Cell Sheet1.B6>,<Cell Sheet1.B7>)
	>>> for sheetObjects in column.columns [1]:
			print(cellObj.value)
	苹果
	樱桃
	梨
	橘子
	苹果
	香蕉
	草莓

修改Excel文档

将值写入单元格很像将值写入字典中的键。将其输入到交互式shell中:

	>>> import openpyxl 
	>>> wb = openpyxl.Workbook() 
	>>> sheet = wb['Sheet'] 
	>>> sheet ['A1'] ='Hello world!' 
	>>> sheet ['A1'].value
	>>> 'Hello world!'

如果将单元格的坐标作为字符串,则可以像Worksheet对象上的字典键一样使用它来指定要写入的单元格。

保存Excel文档

调用openpyxl.Workbook()函数来创建一个新的空白Workbook对象。在交互式shell中输入以下内容:

	>>> import openpyxl 
	>>> wb = openpyxl.Workbook() 
	>>> wb.sheetnames
	['Sheet'] 
	>>> sheet = wb.active 
	>>> sheet.title'Sheet 
	' 
	>>> sheet.title ='Spam Bacon Eggs Sheet' 
	>>> wb.sheetnames 
	['Spam Bacon Eggs Sheet']

该工作簿将以名为Sheet的单张开始。您可以通过在其title属性中存储新字符串来更改工作表的名称。

每次修改Workbook对象或其工作表和单元格时,在调用save()工作簿方法之前,电子表格文件都不会被保存。在交互式shell中输入以下内容(在当前工作目录中使用example.xlsx):

	>>> import openpyxl 
	>>> wb['example.xlsx'] 
	>>> sheet = wb.active 
	>>> sheet.title ='垃圾邮件' 
	>>> wb.save('example_copy.xlsx“)

在这里,我们更改了我们的工作表的名称。为了保存我们的更改,我们将一个文件名作为字符串传递给save()方法。传递与原始文件不同的文件名,例如'example_copy.xlsx',将更改保存到电子表格副本中。当然,保存的时候文件名可以和原本的文件名相同,那样就相当于修改原来的文档,我们这样做只是为了安全,防止程序出错导致原本的文档出现问题。