1、第三方库下载:PyPDF2、PythonMagick、Ghostscript

2、PythonMagick的官方下载链接为:http://www.imagemagick.org/download/python/,需要自己编译;一个好用的非官方链接为:http://www.lfd.uci.edu/~gohlke/pythonlibs/#pythonmagick

3、如果报下面这种错误,多半是因为没装Ghostscript。

RuntimeError: python.exe: PostscriptDelegateFailed `D:\PdfToImage\pdftest.pdf':
No such file or directory @ error/pdf.c/ReadPDFImage/713

4、示例代码:

#encoding=utf-8
#author: walker
#date: 2014-05-15
#summary: 将pdf的每页转换为图片

import PythonMagick
from PyPDF2 import PdfFileReader
pdffile = "pdftest.pdf"
reader = PdfFileReader(file(pdffile, "rb"))
npage = reader.getNumPages()
for i in range(0, npage):
    im = PythonMagick.Image(pdffile + '['+ str(i) +']')
    im.write(pdffile[0:-4] + '_' + str(i)+ '.png')


2014-05-16追加:

发现一个非常好用pdf小工具:mupdf。共包含三个小工具:mupdf.exe,mudraw.exe,mutool.exe。将pdf转图片可以用这个命令:

mudraw -o out%d.png input.pdf


*** walker *** updated 2014-05-16 ***