import os
import pytesseract
from PIL import Image
# 设置 pytesseract 路径
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
# 获取pic目录下的所有图片文件
pic_dir = './pic'
pic_files = [f for f in os.listdir(pic_dir) if f.endswith('.jpg')]
# 遍历所有图片文件并识别文字
with open('out.txt', 'w', encoding='utf-8') as f:
for pic_file in pic_files:
# 打开图片
img_path = os.path.join(pic_dir, pic_file)
try:
with Image.open(img_path) as img:
# 识别文字
text = pytesseract.image_to_string(img, lang='eng')
# 保存文字
f.write(text)
except Exception as e:
print(f"图片 {img_path} 处理出错:{e}")
print('文字提取完成')自动提取pic下面的图片中文字
原创simeon2005 博主文章分类:免费资源 ©著作权
©著作权归作者所有:来自51CTO博客作者simeon2005的原创作品,请联系作者获取转载授权,否则将追究法律责任
提问和评论都可以,用心的回复会被更多人看到
评论
发布评论
相关文章
-
随笔:CUDA和Miniconda3在ubuntu的关系和使用
CUDA和Miniconda3是两种完全不同类型的东西,没有可比性。一个是计算平台,一个是包管理器。安装了Miniconda3,不代表你拥有了CUDA。Miniconda3本身只是一个管理工具。对于深度学习等GPU计算任务,你不需要在系统层面单独安装庞大的CUDA Toolkit。应该利用Miniconda3/Conda的强大功能,在特定的环境中安装所需版本的。这是更简洁、更专业的管理方式。确保先安装好NVIDIA显卡驱动,这是使用GPU进行计算的基础。在Ubuntu上安装NVIDIA显卡驱动。
#ubuntu #CUDA #Miniconda CUDA Python -
24、LangChain开发框架(一)--基础介绍
h复杂状态管理)显著缩短从原型到生产的距离。
#langchain 开发者 持久化 API -
《动手学深度学习》4.6暂退法
在4.5节,我们通过权重衰减来减少模型的过拟合。本节将会介绍另外一种方法,也能达到很好的效果,也就是本节的标题,暂退法。
#深度学习 #人工智能 全连接 H2 随机数
















