本篇博客是 Python 操作 Excel 第三篇博客,核心要学习的模块是 openpyxl,又是一款非常不错的轮子。

正式开始前依旧是模块的安装,使用如下命令即可实现

pip install openpyxl

官方对于该库的描述是:

A Python library to read/write Excel 2010 xlsx/xlsm files

一款用于读写 Excel 2010 xlsx/xlsm 文件的库。

打开已有 Excel 文件

拿到该库之后,直接尝试打开一个本地 Excel ,然后才能对其中的数据进行控制。

from openpyxl  import load_workbook
wb = load_workbook('测试表格.xlsx')

# 输出
# <openpyxl.workbook.workbook.Workbook object at 0x00000195680F96D0>

继续编码前还是需要了解一些关于 Excel 的相关知识点,如下所示:

  • Excel 中列名是字母,行号是数字,例如锁定第一个单元格是 A1,然后是 A2,接下来是A3;
  • Excel 中有工作簿,工作表,单元格三个概念组成,对应到 openpyxl 中就是 Workbook 类,Worksheet 类,Cell 类。

操作 Excel 基本遵循三步走策略

  • 打开 Excel,产生 Workbook 对象;
  • 获取表格对象,即 Worksheet 对象;
  • 操作表格中的单元格对象,即 Cell 对象。

有这些概念之后,你会发现后续的代码就会变得极容易理解。

创建一个 Excel 文件,并修改 sheet

接下来的代码将会创建一个 Excel 文件,并将第一个默认 sheet 修改为【测试】

import openpyxl

if __name__ == '__main__':
    wb = openpyxl.Workbook()
    ws = wb.active

    # 更改第一个 sheet 名称
    ws.title = "测试"

    # 保存
    wb.save('example.xlsx')

在 Python 文件的运行目录会生成如下文件,打开关注第一个 sheet 即可。

python控制excel占用空间 python控制excel控件_python excel

如果希望创建第二个表格页(sheet),继续在 Workbook 对象中追加 sheet 即可。

import openpyxl

if __name__ == '__main__':
    wb = openpyxl.Workbook()
    ws = wb.active

    # 更改第一个 sheet 页名称
    ws.title = "Sheet1"
    # 新增第二个 sheet 页
    ws2 = wb.create_sheet("Sheet2")

    # 新增第三个 sheet 页
    # 将 create_sheet() 函数中的第二个参数定义为 0,表示该 sheet 在最前面
    ws3 = wb.create_sheet("Sheet3", 0)
    # 保存
    wb.save('example.xlsx')

追加 sheet 使用的函数是 create_sheet() ,在使用的时候,可以根据第二个参数进行顺序设置。

python控制excel占用空间 python控制excel控件_python excel_02

如果你希望对 sheet 页签进行更细节的设置,可以进行属性配置,例如修改 sheet 页签背景

import openpyxl

if __name__ == '__main__':
    wb = openpyxl.Workbook()
    ws = wb.active

    # 更改第一个 sheet 页名称
    ws.title = "Sheet1"

    ws.sheet_properties.tabColor = "03a9f4"
    # 新增第二个 sheet 页
    ws2 = wb.create_sheet("Sheet2")

    # 新增第三个 sheet 页
    # 将 create_sheet() 函数中的第二个参数定义为 0,表示该 sheet 在最前面
    ws3 = wb.create_sheet("Sheet3", 0)
    # 保存
    wb.save('example.xlsx')

python控制excel占用空间 python控制excel控件_python_03

选择 sheet 的不同方式

使用 wb["Sheet1"] 可以通过类字典模式进行 sheet 读取,还可以使用 get_sheet_by_name() 方法进行调用,但是该方法已被弃用,建议掌握第一种用法即可。

import openpyxl

if __name__ == '__main__':
    wb = openpyxl.Workbook()
    ws = wb.active

    # 更改第一个 sheet 页名称
    ws.title = "Sheet1"

    ws_1 = wb["Sheet1"]
    ws_1_1 = wb.get_sheet_by_name("Sheet1")  # 该方法将被弃用,建议用上述形式调用

    print(ws_1)
    print(ws_1_1)

    # wb.save('example.xlsx')

Worksheet对象

Worksheet 对象即表格对象,用于得到单元格中的数据,修改表格中的内容。优先学习的相关属性如下所示:

  • title:表格的标题;
  • dimensions:表格数据区域大小;
  • max_row:表格的最大行;
  • min_row:表格的最小行;
  • max_column:表格的最大列;
  • min_column:表格的最小列;
  • rows:按行获取单元格(Cell)对象 ,返回生成器;
  • columns:按列获取单元格(Cell对象),返回生成器。

具体代码如下所示,其中用到的表格参考下述截图

from openpyxl  import load_workbook
wb = load_workbook('测试表格.xlsx')

if __name__ == '__main__':

    ws = wb.active

    # 更改第一个 sheet 页名称
    ws.title = "My_Sheet"

    ws_1 = wb["My_Sheet"]

    print(ws_1.title)  # 获取标题
    print(ws_1.dimensions)  # 有数据的区域大小,无数据是 A1:A1
    print(ws_1.max_row) # 最大行数
    print(ws_1.min_row) # 最小行数

    print(ws_1.max_column)
    print(ws_1.min_column)

    print(ws_1.rows)
    print(ws_1.columns)

python控制excel占用空间 python控制excel控件_python excel_04

除属性外,Worksheet 对象的方法如下所示
Worksheet方法如下:

  • iter_rows:按行获取所有单元格,其值可以调用 Cell 的属性(min_row, max_row, min_col, max_col);
  • iter_columns:按列获取所有的单元格
  • append:在表格末尾添加数据
  • merged_cells:合并多个单元格
  • unmerged_cells:移除合并的单元格

Worksheet 对象的属性和方法基本都会返回 Cell对象,即单元格对象。

Cell 对象

Cell对象比较简单,常用的属性如下:

  • row :单元格所在的行
  • column:单元格坐在的列
  • value:单元格的值
  • coordinate:单元格的坐标
from openpyxl import load_workbook

wb = load_workbook('测试表格.xlsx')

if __name__ == '__main__':

    ws = wb.active

    for item in ws.rows:
        print(item)  # 按照行输出
        print(item[0].value)  # 输出单元格的值

操作修改单元格数据
获取单元格之后,就可以对其中的值进行操作,例如下述代码

from openpyxl import load_workbook

wb = load_workbook('测试表格.xlsx')

if __name__ == '__main__':

    ws = wb.active
    # 输出修改前
    for item in ws.rows:
        print(item)  # 按照行输出
        print(item[0].value)  # 输出单元格的值
        item[0].value = 1
    # 输出修改后的值,注意不保存文件,数据不会存储
    for item in ws.rows:
        print(item[0].value)  # 输出单元格的值
    # wb.save('example.xlsx')

单元格内容修改完毕之后,需要使用 wb.save() 方法才可以存储文件修改之后的内容。

使用行列式定位单元格
使用工作表的 cell() 方法,可以定位到单元格,具体用法如下所示

from openpyxl import load_workbook

wb = load_workbook('测试表格.xlsx')

if __name__ == '__main__':

    ws = wb.active
    # 输出修改前
    for item in ws.rows:
        print(item)  # 按照行输出
        print(item[0].value)  # 输出单元格的值
        item[0].value = 1
    # 输出修改后的值,注意不保存文件,数据不会存储
    for item in ws.rows:
        print(item[0].value)  # 输出单元格的值

    # 直接定位单元格
    c = ws.cell(row=2, column=3)
    print(c)
    print("单元格A2,B3里面的内容是",c.value)
    wb.save('example.xlsx')

单元格插入图像

使用如下代码,可以在Excel 中的单元格内添加图片。
在正式编码前,先导入如下模块

from openpyxl.drawing.image import Image

接下来就可以在对应的单元格中去添加相应的图片了,具体代码如下所示,其中比较重要的是 add_image() 方法。

# 创建图像,参数是图片路径
img = Image('cup_PNG2001.png')
# add_image(图片,要添加单元格的位置)
ws.add_image(img, 'A2')

wb.save('example.xlsx')

设置单元格样式

在 Excel 中,我们可以针对单元格样式进行操作,例如加粗,倾斜,背景色。

需要提前导入的相关类

from openpyxl.styles import Font, colors, Alignment

接下来可以修改相应的字体

from openpyxl import load_workbook
from openpyxl.styles import Font, colors, Alignment

wb = load_workbook('测试表格.xlsx')

if __name__ == '__main__':
    ws = wb.active
 
    c_style = Font(size=20, bold=True, italic=True, color='ff0000')

    ws['A1'].font = c_style

    wb.save('example.xlsx')

运行结果如下所示,注意 A1 单元格相关变化。在这里需要注意代码中只要存在一处错误,新的样式就不会起到作用。

python控制excel占用空间 python控制excel控件_后端_05

其它内容你可自行进行扩展,例如设置对齐方式

ws['B1'].alignment = Alignment(horizontal='center', vertical='center')

python控制excel占用空间 python控制excel控件_python控制excel占用空间_06

行高,列宽,单元格合并与取消合并,这些内容由你自行完成。