import zipfile
import os
import shutil
def doc_to_png(file_name):
zip_name = file_name.replace("docx", 'zip').replace("doc", 'zip')
os.rename(file_name, zip_name) # 修改后缀为zip
f = zipfile.ZipFile(zip_name, 'r') # 解压文件
# 将图片提取并保存
for file in f.namelist():
f.extract(file, zip_name[:-4])
# 恢复后缀
os.rename(zip_name, file_name)
# 删除多余的文件
os.system(f"cp -r {zip_name[:-4]}/word/media/ {zip_name[:-4]}img")
shutil.rmtree(zip_name[:-4])
# 释放文件
f.close()
# word所在文件夹位置
path = r"/Users/hunliji/Downloads/"
# 获取文件夹中的所有文件
filenames = os.listdir(path)
for filename in filenames:
if filename.__contains__('doc'):
doc_to_png(path + filename)
【案例】Python批量提取word中的图片
转载
地振高冈,一派溪山千古秀;门朝大海,三合河水万年流。
本文章为转载内容,我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题,欢迎原作者联系我们进行内容更正或删除文章。
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
java提取word中的图片
一、项目中需要用到word的导入,word 里面的内容由图片,文本,公式等,步骤为:将文档另存为xml格式1、提取图片
java xml 获取图片 宽高 数组