Python基于pdf2docx库:将PDF文件转换为Word文档_2d

以上是原pdf格式文件;

目标:我们需要将PDF转换为docx文档

需要安装使用:pdf2docx库

安装:pdf2docx

pip install pdf2docx
import os
from pdf2docx import Converter

# 定义PDF文件和Word文档的路径
pdf_file_path = 'D:\\daku\\pdfzwd\\2401.14404.pdf'
doc_file_path = 'D:\\daku\\pdfzwd\\2401.14.docx'

# 检查PDF文件是否存在
if not os.path.exists(pdf_file_path):
    print("PDF文件不存在,请检查路径是否正确。")
    exit()

# 转换PDF文件为Word文档
converter = Converter(pdf_file_path)
converter.convert(doc_file_path, start=0, end=None)  # 转换所有页面
converter.close()
print("Word文档已成功保存。")

Python基于pdf2docx库:将PDF文件转换为Word文档_2d_02

以上图片就是Python基于pdf2docx库:将PDF文件转换为Word文档的结果。