以上是原pdf格式文件;
目标:我们需要将PDF转换为docx文档
需要安装使用:pdf2docx库
安装:pdf2docx
pip install pdf2docx
import os
from pdf2docx import Converter
# 定义PDF文件和Word文档的路径
pdf_file_path = 'D:\\daku\\pdfzwd\\2401.14404.pdf'
doc_file_path = 'D:\\daku\\pdfzwd\\2401.14.docx'
# 检查PDF文件是否存在
if not os.path.exists(pdf_file_path):
print("PDF文件不存在,请检查路径是否正确。")
exit()
# 转换PDF文件为Word文档
converter = Converter(pdf_file_path)
converter.convert(doc_file_path, start=0, end=None) # 转换所有页面
converter.close()
print("Word文档已成功保存。")
以上图片就是Python基于pdf2docx库:将PDF文件转换为Word文档的结果。