__author__ = 'Jeff.xie'
import fitz
sourcefile="D:\\Project\\xxx.pdf";
# inst是fitz.Rect包含找到的文本片段的左上角和右下角坐标的对象。所有信息都可以在docs中找到。
# 我设法使用下面的代码片段突出显示点并保存裁剪区域。我正在使用python 3.7.1,我的输出fitz.version是('1.14.13', '1.14.0', '20190407064320')。
doc = fitz.open(sourcefile)
inst_counter = 0
for pi in range(doc.pageCount):
page = doc[pi]
# text = "FT21106F7PGQ"
text = "FT21097G4TGP"
text_instances = page.searchFor(text)
# 数字越小,截取的高度越小
five_percent_height = (page.rect.br.y - page.rect.tl.y)*0.02
for inst in text_instances:
inst_counter += 1
highlight = page.addHighlightAnnot(inst)
# define a suitable cropping box which spans the whole page
# and adds padding around the highlighted text
tl_pt = fitz.Point(page.rect.tl.x, max(page.rect.tl.y, inst.tl.y - five_percent_height))
br_pt = fitz.Point(page.rect.br.x, min(page.rect.br.y, inst.br.y + five_percent_height))
hl_clip = fitz.Rect(tl_pt, br_pt)
zoom_mat = fitz.Matrix(4, 4) #数字越大,截取图片的清晰度越高
pix = page.getPixmap(matrix=zoom_mat, clip = hl_clip)
# pix.writePNG(f"pg{pi}-hl{inst_counter}.png")
pix.writePNG(r"D:\\shot55.png")
python中fit python中fitz
原创
©著作权归作者所有:来自51CTO博客作者信息流星的原创作品,请联系作者获取转载授权,否则将追究法律责任
本文章为转载内容,我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题,欢迎原作者联系我们进行内容更正或删除文章。
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
Python fit函数 python fitz
安装fitz(需要依赖PyMuPDF)
html 文件名 Image -
FreeBSD 二进制安装nginx
使用系统二进制源方式安装在Ubuntu/Debian系sudo apt-get install nginx或者RedHat/CentOS系sudo yum install nginx这种方式最简单的,最快捷的方式,但是不是最好的方式,下面我们来说这种主要问题。优点所有安装二进制依赖已经处理好了,不用担心兼容性问题,开箱即用Nginx的连接配置,用户权限这个都不用处理,已经帮你写好这块了不用担心Ng
FreeBSD 二进制安装nginx linux服务器nginx安装 centos nginx debian nginx安装 nginx安装 -
离线安装zabbix详细步骤
解决Mysql报错缺少libaio.so.1报错如上图,需要安装libaio.so.164位系统安装:wget http://mirror.centos.org/centos/6/os/x86_64/Packages/libaio-0.3.107-10.el6.x86_64.rpmrpm -ivh libaio-0.3.107-10.el6.x86_64.rpm32位系统现在很
离线安装zabbix详细步骤 linux 提示libaio.so.1 oracle centos java代码