今天学习Django时,无意看到了pdf的报表类库Reportlab,使用该库可以很容易的生成pdf。其中介绍最多的是将图片转换为pdf,网上也有相关的介绍(Python Reportlab转换jpg为pdf),不过这些网上的介绍几乎全都是转自一篇博客的内容,代码是一模一样的。本来打算直接使用文章提供的代码,但发现改代码没有考虑图片尺寸与pdf只存之间的匹配,导致转换出来部分数据丢失。下面记录一下相应代码的修改过程:

一、基础知识

Reportlab是Python平台上优秀的报表类库,由于不属于python的标准类库,所以需要手动安装,下载地址:https://www.reportlab.com/software/downloads/。由于涉及到图片处理,还需要安装Python imaging library(PIL)类库。Reportlab库和PIL库下载完成后直接安装即可(建议先安装PIL库)。安装完成后,可以在python shell下执行import reportlab.pdfgen命令来测试是否安装正确。

python图像处理库——PIL,用于处理图像文件。PIL提供了功能丰富的方法,比如格式转换、旋转、裁剪、改变尺寸、像素处理、图片合并等等等等,非常强大。

二、代码实现

代码使用图片如下:


1、网上版本:

#! /usr/bin/env python
#coding=utf-8
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import A4,landscape
def convert_to_pdf(filename):
newname=filename[:filename.rindex('.')]+'.pdf'
w,h=landscape(A4)
c=canvas.Canvas(newname,pagesize=(w,h))
c.drawImage(filename,0,0,w,h)
c.save()
c.showPage()
print "convert finish"

由于Reportlab的Canvas画布的大小默认是A4大小,所以网上程序代码只是从图片中截取了A4大小的部分来生成pdf,导致图片很长或很宽时生成的图片比例失调。因此我们需要修改代码来适应不同尺寸的图片。

ps:landscape()函数的作用是获取A4大小的宽和高,Canvas()中第二个参数是一个宽和高组成的元祖用来表明生成pdf的大小。drawImage()函数的后四个参数用来指明图片在pdf中所占的区域,因此由于上面示例代码将图片放到了A4大小的区域中所以比例失调。


现在改进有两种方法:一是pdf画布大小仍是A4,只是将图片按照相应比例进行缩放;二是修改pdf画布的尺寸为图片的尺寸,即根据图片的大小来调整pdf的大小。、

2、改进方法1:pdf仍是A4大小,图片按相应比例进行缩放

#! /usr/bin/env python
#coding=utf-8
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import A4,landscape
import Image
def convert_to_pdf1(filename):
im=Image.open(filename)
im_w,im_h=im.size
a4_w,a4_h=landscape(A4)
newname=filename[:filename.rindex('.')]+'.pdf'
c=canvas.Canvas(newname,pagesize=(a4_w,a4_h))
if a4_w/im_w
ratio=a4_w/im_w
else:
ratio=a4_h/im_h
c.drawImage(filename,0,0,im_w*ratio,im_h*ratio)
c.save()
c.showPage()
print "convert finish"

结果:


可以看到这次没有失真,只是由于图片太长了导致显示非常小。那我们尝试一下第二种改进方法:按照图片的大小来生成pdf

3、改进方法2:按照图片的大小来生成pdf

ps:按照图片大小来生成pdf的意思是按照图片的大小来生成画布。

#! /usr/bin/env python
#coding=utf-8
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import A4,landscape
import Image
def convert_to_pdf2(filename):
im=Image.open(filename)
im_w,im_h=im.size
newname=filename[:filename.rindex('.')]+'.pdf'
c=canvas.Canvas(newname,pagesize=(im_w,im_h))
c.drawImage(filename,0,0,im_w,im_h)
c.save()
c.showPage()
print "convert finish"
convert_to_pdf2('a.jpg')


可以看到按照图片尺寸生成的pdf展示图片非常清晰,但是非常长,看起来比第一种改进方法要好一点。不过,如果要打印的话两种改进方法应该是一样的。

所以,最好的改进方法是能够将图片生成为多页pdf,而不是将其写进一页pdf中。如何改进还没想好。

———————————————————————————————————————–

参考代码:

使用python进行图像处理-调整图片大小

python有一个图像处理库——PIL,可以处理图像文件。PIL提供了功能丰富的方法,比如格式转换、旋转、裁剪、改变尺寸、像素处理、图片合并等等等等,非常强大。

举个简单的例子,调整图片的大小:

infile = 'D:\\original_img.jpg'
outfile = 'D:\\adjust_img.jpg'
im = Image.open(infile)
(x,y) = im.size #read image size
x_s = 250 #define standard width
y_s = y * x_s / x #calc height based on standard width
out = im.resize((x_s,y_s),Image.ANTIALIAS) #resize image with high-quality
out.save(outfile)
print 'original size: ',x,y
print 'adjust size: ',x_s,y_s
'''
OUTPUT:
original size:  500 358
adjust size:  250 179
'''

参考资料:

Python Reportlab转换jpg为pdf    http://www.2cto.com/kf/201303/194306.html

使用python进行图像处理-调整图片大小  http://robin.sh/html/750_python-image-pil.html