一、pypdf2的使用

from PyPDF2 import PdfReader, PdfWriter#导入

1.pdf文件读操作

1)读取文件reader

reader = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')#读到这个文件

2)获取总的页数

num = reader.getNumPages()
print(num)

3)获取指定的页(页数从0开始)

p1 = reader.getPage(0)#第一页(相当于下标)
p2 = reader.getPage(1)

2.pdf文件写操作

1)创建一个空的pdf

writer = PdfWriter()

2)添加指定页

writer.addPage(p1)
writer.addPage(p2)

3)添加空白页

writer.addBlankPage()

4)插入指定页

writer.insertPage(p1, 2)#后面是下标(相当于插入在第三页(2)前面)

5)保存

writer.write('files/new.pdf')#保存路径可以不写原文件的名字,就不会覆盖

3.添加水印

from PyPDF2 import PdfWriter, PdfReader
import os

1.准备水印页面

reader1 = PdfReader('files/water.pdf')
water = reader1.getPage(0)

2.准备需要添加水印的文件

reader2 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
page = reader2.getPage(0)

3.添加水印

page.mergePage(water)

4.将添加完水印的页面添加到空的pdf中

writer = PdfWriter()
writer.addPage(page)

writer.write('files/水印1.pdf')

4.练习题

1.给MySQL.pdf文件添加封面

from PyPDF2 import PdfReader, PdfWriter
# 1)准备封面
reader1 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
cover = reader1.getPage(0)
# 2)需要添加封面的文件的reader
reader2 = PdfReader('files/MySQL.pdf')
# 3)准备空的pdf
writer = PdfWriter()
# 4)往空的pdf中加页面
writer.addPage(cover)
for x in range(reader2.getNumPages()):
    page = reader2.getPage(x)
    writer.addPage(page)
writer.write('files/MySQL.pdf')

2.将两个pdf文件合并成一个pdf文件

# 1)准备需要合并pdf文件对应的reader
reader1 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
reader2 = PdfReader('files/MySQL.pdf')

# 2)准备空的pdf对应的writer
writer = PdfWriter()

# 3)依次添加reader中的页面
for x in range(reader1.getNumPages()):
    page = reader1.getPage(x)
    writer.addPage(page)
for x in range(reader2.getNumPages()):
    page = reader2.getPage(x)
    writer.addPage(page)
writer.write('files/合并.pdf')

3.删除pdf文件中所有下标为奇数的页(下标从0开始)

# 1)准备需要删除页面的pdf
reader = PdfReader('files/MySQL.pdf')

# 2)准备新的pdf
writer = PdfWriter()

# 3)将下标为偶数的页添加到新的pdf中
for x in range(0, reader.getNumPages(), 2):
    page = reader.getPage(x)
    writer.addPage(page)

writer.write('files/new_mysql.pdf')

4.在pdf文件中的每一页的后添加都添加一个空白页

reader = PdfReader('files/MySQL.pdf')
writer = PdfWriter()
for x in range(reader.getNumPages()):
    page = reader.getPage(x)
    writer.addPage(page)
    writer.addBlankPage()

writer.write('files/new_mysql2.pdf')

5.练习:给pdf文件的每一页都添加上水印

water = PdfReader('files/water.pdf').getPage(0)
reader = PdfReader('files/MySQL.pdf')
writer = PdfWriter()
for x in range(reader.getNumPages()):
    page = reader.getPage(x)
    page.mergePage(water)
    writer.addPage(page)
writer.write('files/mysql(水印).pdf')

6.自己的写法(和老师一样,方便回顾看)

from PyPDF2 import PdfReader,PdfWriter
reader = PdfReader('files/MySQL.pdf')
num = reader.getNumPages()
p1 = reader.getPage(0)
writer = PdfWriter()#创建空的pdf
# 1.给MySQL.pdf文件添加封面
for x in range(0,num):
    px = reader.getPage(x)#获取页
    writer.addPage(px)
writer.insertPage(p1,0)
writer.write('files/N_MySQL.pdf')

# 2.将两个pdf文件合并成一个pdf文件
writer1 = PdfWriter()#创建空的pdf
reader1 = PdfReader('files/HEU_KMS_Activator_v20.0.0用户使用手册.pdf')
num = reader.getNumPages()
num1 = reader1.getNumPages()
for x in range(0,num):
    px = reader.getPage(x)#获取页
    writer1.addPage(px)
for y in range(0,num1):
    py = reader1.getPage(y)
    writer1.addPage(py)
writer1.write('files/M_H.pdf')

# 3.删除pdf文件中所有下标为奇数的页(下标从0开始)
writer3 = PdfWriter()#创建空的pdf
for x in range(0,num,2):
    px = reader.getPage(x)#获取页
    writer3.addPage(px)
writer3.write('files/3oushu.pdf')

# 4.在pdf文件中的每一页的后添加都添加一个空白页
writer4 = PdfWriter()#创建空的pdf
for x in range(num):
    px = reader.getPage(x)
    writer4.addPage(px)
    writer4.addBlankPage()
writer4.write('files/加kb.pdf')

# 练习5:给pdf文件的每一页都添加上水印

reader2 = PdfReader('files/water.pdf')
sy = reader2.getPage(0)
writer5 = PdfWriter()#创建空的pdf
for x in range(num):
    px = reader.getPage(x)
    px.mergePage(sy)
    writer5.addPage(px)
writer5.write('files/加sy.pdf')

二、创建水印-用画布

# 用来创建画布(常见空白的pdf文件)
from reportlab.pdfgen.canvas import Canvas
# 用来对字体进行注册
from reportlab.pdfbase.pdfmetrics import registerFont
from reportlab.pdfbase.ttfonts import TTFont

1.创建一个空白文件(画布)

# 在指定的位置新建空白的pdf文件:Canvas(文件路径)
file = Canvas('files/MyWater.pdf')

2.添加文字

1)注册字体

registerFont(TTFont('f1', 'files/font1.ttf'))
registerFont(TTFont('f2', 'files/font2.ttf'))#字体需要提前下载放入文件夹

2)设置字体的名字和字体大小

file.setFont('f2', 40)#字体名和大小,用前面注册的名字

3)设置字体颜色

# r、g、b: 0 ~ 1(用颜色的rgb值除以255)
# 透明度:0 ~ 1,0是完全透明,1是不透明
file.setFillColorRGB(139/255, 69/255, 19/255, 0.7)

4)旋转

file.rotate(45)#旋转的是画布

# 文件对象.drawString(x坐标, y坐标,'内容' )
file.drawString(200, 100, '你好世界!')#上面画布旋转了45度,所以此时输入的内容是呈现旋转以后的样式

file.rotate(-45)#将画布旋转回来
file.setFont('f1', 12)
file.setFillColorRGB(180/255, 180/255, 180/255, 0.7)
file.drawString(100, 0, 'hello world!')#画布旋转回来以后新输入的内容呈现的样式是正常样式(非倾斜),原本已经倾斜的不会随着画布后面转回而转回来

3.渲染图片

# 文件对象.drawImage(图片地址, x坐标, y坐标, mask='auto')
file.drawImage('files/car.png', 0, 0, mask='auto')

# 保存
file.save()#保存不需要提供地址了,画布在创建时已经提供了地址。

三、补充:获取文件夹中所有的文件的名字: os.listdir(文件夹地址)

result = os.listdir('files')#列表

1.练习作业

*导入相关模块

from reportlab.pdfgen.canvas import Canvas#画布模块
from reportlab.pdfbase.pdfmetrics import registerFont#注册字体
from reportlab.pdfbase.ttfonts import TTFont#注册字体
from PyPDF2 import PdfReader, PdfWriter#pdf读和写
import os#可以获取文件夹相关数据,批量操作pdf加水印

1)准备一个水印

hb = Canvas('files/sy-dog.pdf')
registerFont(TTFont('f1', 'files/zt.ttf'))
hb.setFont('f1', 40)
hb.setFillColorRGB(150/255, 63/255, 28/255, 0.4)
hb.rotate(50)
hb.drawString(450, 80, '哒哒哒哒哒~')
hb.rotate(-20)
hb.drawImage('files/dog.png', 260,50, mask='auto')
hb.save()

#满屏水印
hb = Canvas('files/sy-dog.pdf')
registerFont(TTFont('f1', 'files/zt.ttf'))
hb.setFont('f1', 40)
hb.setFillColorRGB(150/255, 63/255, 28/255, 0.4)
hb.rotate(50)
hb.drawString(450, 80, '哒哒哒哒哒~')
hb.rotate(-20)
for x in range(-400,1200,100):
    for y in range(-400,1200,100):
        hb.drawImage('files/dog.png', x,y, mask='auto',width=40,preserveAspectRatio=True)
hb.save()

2)给单个pdf每一页加水印

reader = PdfReader('files/sy-dog.pdf')
sy = reader.getPage(0)
reader1 = PdfReader('files/MySQL.pdf')
num = reader1.getNumPages()
writer = PdfWriter()
for x in range(num):
    px = reader1.getPage(x)
    px.mergePage(sy)
    writer.addPage(px)
writer.write('files/加水印版mysql.pdf')

3)给批量pdf加水印(每页)

writer1 = PdfWriter()
result = os.listdir('input')
for x in result:
    path = 'output/' + x
    reader3 = PdfReader('input/'+x)
    num1 = reader3.getNumPages()
    for y in range(num1):
        py = reader3.getPage(y)
        py.mergePage(sy)
        writer1.addPage(py)
    writer1.write(path)