我们都是Python可以操作表格文本,以及图片处理,但是今天我就给大家分享一个Python 是如何操作world文档。

安装python-docx

docx的详细操作

实战经验分享

很熟悉的1,2,3 就像那个看似简单又时难的问题,把大象放进冰箱怎么操作? 对的就是那么简单分三步:打开冰箱(安装python-docx)

放进大象(docx的详细操作)

关上冰箱(实战经验分享)

无论现在你对于Python-docx是陌生还是了解,接下来和我走进Python学习的三部曲中,你会得到不一样的收获。

安装python-docx

首先Python的版本选择,一般选择Python3.4,由于官方对于Python2版本的不更新处理,所有没有任何犹豫,直接选择Python3版本以上就可以。

windows和linux的Python 环境下安装操作如下:

pip install python-docx

也可以选择 直接从官网搜索 Python python-docx 进入官网下载版本解压安装

tar xvzf python-docx-{version}.tar.gz

cd python-docx-{version}

python setup.py install

本地的Pycharm编辑器安装的话,点击Settings -->>Project Interpreter-->>点击+输入python-docx进行搜索安装即可。

docx的详细操作

首先导入需要的类库类库

from docx import Document

from docx.oxml.ns import qn

from docx.shared import Pt

from docx.shared import Inches

新建一个文档

document = Document()

创建字体样式

document.styles['Normal'].font.name = u'宋体'

document.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')

字体和文档已经建好之后,开始添加一个标题,每一个wolrd的文档都是从标题开始

document.add_heading('Python is the best programming language')

标题设置,还可以选择等级,一般是从1-9等级

document.add_heading('Python is the best programming language', level=4)

关于文档的编辑,分页是需要的

document.add_page_break()

Python-docx的操作基本就入门了,段落+分页+标题已经是文档的标配。

接下来我们将一步一步的深入docx的操作,远远不止段落和标题的操作。

添加表格,在文档中添加表格是一种数据展示最好的方式。

#添加2行2列的表格

table = document.add_table(rows=2, cols=2)

定位单元格属性之后并可以操作改单元格的内容以及其他的样式设置

cell = table.cell(0, 1) cell.text = 'Python 是最好的编程语言'

单元格可以定位,同样的表格的行也可以实现定位,还可以进行批量的内容输入,for循环搞定逐行写入。

row = table.rows[1]

row.cells[0].text = 'Python可以实现文档的编辑操作'

row.cells[1].text = 'Python也可以实现网络爬虫'

for row in table.rows:

for cell in row.cells:

print(cell.text)

再给表格添加一个样式:

table.style = 'LightShading-Accent1'

Python-docx可以操作表格,那么也少不了图片的的添加。

document.add_picture('Python_images.png')

这个的图片路径是一般还是选择本地的路径吧,如果引入网络地址或者服务器上的图片资源路径可能会非常的缓慢。

指定图片尺寸大小

document.add_picture('image-filename.png', width=Inches(1.0))

接下来我们就给文档内容添加一些样式。

paragraph = document.add_paragraph()

paragraph.add_run('Python is the best programming language')

paragraph.add_run('Python可以实现文档的编辑操作').bold = True

paragraph.add_run(' XXX还可以继续添加内容')

字体设置一般包括(字体、大小、颜色、粗体、斜体)

paragraph = document.add_paragraph('ython is the best programming language')

paragraph.add_run('Python可以实现文档的编辑操作', '宋体')

另外一种字体设置方式

paragraph = document.add_paragraph('ython is the best programming language')

run = paragraph.add_run('Python可以实现文档的编辑操作')

run.style = '宋体'

字体的格式

from docx.shared import Pt

from docx import Document

document = Document()

run = document.add_paragraph().add_run()

font = run.font

font.name = 'Calibri'

font.size = Pt(12)

#斜体设置 True是开,False是关

font.italic = True

# 下划线

font.underline = True

#字体颜色

from docx.shared import RGBColor

font.color.rgb = RGBColor(0x42, 0x24, 0xE9)

#恢复字体颜色

font.color.rgb = None

设置段落的水平对齐

from docx.enum.text import WD_PARAGRAPH_ALIGNMENT

document = Document()

paragraph = document.add_paragraph()

paragraph_format = paragraph.paragraph_format

paragraph_format.alignment

paragraph_format.alignment = WD_ALIGN_PARAGRAPH.CENTER

设置段落左侧缩进

from docx.shared import Inches

paragraph = document.add_paragraph()

paragraph_format = paragraph.paragraph_format

paragraph_format.left_indent = Inches(0.5)

设置段落右侧缩进

from docx.shared import Pt

paragraph_format.right_indent

paragraph_format.right_indent = Pt(24)

第一行缩进使用first_line_indent属性指定,并相对于左缩进进行解释。负值表示挂起缩进

paragraph_format.first_line_indent

paragraph_format.first_line_indent = Inches(-0.25)

paragraph_format.first_line_indent

设置制表符

tab_stop = tab_stops.add_tab_stop(Inches(1.5)) tab_stop.position

设置段落间距

paragraph_format.space_before = Pt(18)

设置行间距

from docx.shared import Length paragraph_format.line_spacing = Pt(18)

添加分页:

paragraph_format.keep_with_next = True

属性基本设置完毕后就可以指定路径保存并生成文档

document.save('test.docx')

以上是文档的编辑,Python-docx对于文档的读取如下:

f = open('test.docx', 'rb')

document = Document(f)

f.close()

# 或者

with open('test.docx', 'rb') as f:

s = StringIO(f.read())

document = Document(s)

s.close()

实战经验分享:附加我个人实战经验分享