Python 读取eps文件 python读取pdf文档

关注 mob6454cc64e36b

Python 读取eps文件 python读取pdf文档

转载

mob6454cc64e36b 2021-10-27 12:20:10

文章标签 python pycharm 开发语言绝对路径相对路径 文章分类 Python 后端开发

学习python，不用再为pdf无法转换而烦恼~~~

下面我们介绍python读取pdf文件（主要是针对文字部分）

1、打开环境

2、安装pdfminer3k包

可以使用jupyter notebook进行安装，如下图所示：

Python 读取eps文件 python读取pdf文档_开发语言

安装成功，大功告成第一步。

3、导入相关的包：

from io import StringIO
 from pdfminer.pdfinterp import PDFResourceManager
 from pdfminer.pdfinterp import process_pdf
 from pdfminer.converter import TextConverter
 from pdfminer.layout import LAParams
 import re

如图：

Python 读取eps文件 python读取pdf文档_开发语言_02

4、定义一个读取pdf文档的函数：

def read_from_pdf(file_path):
     """
     读取pdf文件
     """
     with open(file_path,'rb') as file:
         resource_manager = PDFResourceManager()
         return_str = StringIO()
         lap_params = LAParams()
         device = TextConverter(resource_manager,return_str,laparams=lap_params)
         process_pdf(resource_manager,device,file)
         device.close()
         content = return_str.getvalue()
         return_str.close()
         return re.sub('\s+','',content)

Python 读取eps文件 python读取pdf文档_相对路径_03

5、使用定义的函数进行测试实验：

read_from_pdf('葡萄酒数据挖掘.pdf')

根据你自己的pdf文件和具体情况进行实验，路径可以是绝对路径和相对路径，任意实验。

Python 读取eps文件 python读取pdf文档_python_04

实验效果还不错，学习起来吧~~~

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：java递归return后还执行 java 递归 return

下一篇：MySQL删除不为空的记录 mysqli删除

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册