文章目录
- 一.确定虚拟环境中的Cudatoolkit、cudnn以及paddlepaddle版本
- 1.查看电脑支持的cudatoolkit版本
- 2.查看支持飞桨的CUDA版本号
- 二、配置paddleOCR虚拟环境
- 1.创建paddleOCR虚拟环境
- 2.激活paddleOCR虚拟环境
- 3.安装cudatoolkit
- 4.安装cudnn
- 5.安装paddlepaddle和paddleOCR
- 三、验证环境
- 1.验证基础环境
- 2.图片测试
一.确定虚拟环境中的Cudatoolkit、cudnn以及paddlepaddle版本
我的电脑是NVIDIA GeForce RTX 3060,电脑配置了cuda12.0和cudnn8.9.4(如何配置请参考 配置cuda和cudnn), 安装了Anaconda。
下面配置PaddleOCR中的cudatoolkit版本不得超过自己电脑上装的cuda版本号
1.查看电脑支持的cudatoolkit版本
使用conda search cudatoolkit
命令
查看电脑支持的cudnn版本,使用conda search cudnn
,倒数第一个支持cuda11.*版本
我的电脑最支持cudatoolkit《=12.0,之前的踩坑实践得出:cuda大于11的就不能装cuda小于11的版本,这样会导致算力不匹配,影响效率。
2.查看支持飞桨的CUDA版本号
飞桨(官网:飞桨PaddlePaddle-源于产业实践的开源深度学习平台)是基于CUDA10.2,11.2,11.6,11.8,12.0开发的,这里要注意一下,不要提前下好cuda导致找不到合适的飞桨版本号。
基于以上查询,选择cudatoolkit = 11.8,cudnn = 8.9.2.26,paddlepaddle = 11.8配置paddleOCR虚拟环境。
二、配置paddleOCR虚拟环境
1.创建paddleOCR虚拟环境
使用conda create -n paddleOCR python
创建,遇到下列提示输入y
开始下载基础模块
当出现以下界就说明虚拟环境建好了
2.激活paddleOCR虚拟环境
使用conda acitvate paddleOCR
命令,当cmd前面出现虚拟环境名称则已激活
3.安装cudatoolkit
使用conda install cudatoolkit=11.8
命令
开始等待下载
出现下面界面则说明下载好了
4.安装cudnn
使用conda install cudnn=8.9.2.26
命令
5.安装paddlepaddle和paddleOCR
使用python -m pip install paddlepaddle-gpu==2.5.1 -i https://pypi.tuna.tsinghua.edu.cn/simple
命令安装
经过以上,则基础环境就配置好了,还剩一些PaddleOCR的小模块,可以使用pycharm将打开paddleOCR,配置好程序的虚拟环境后,使用pip install -r requirements.txt -i https://pypi.douban.com/simple/
安装,如果程序还报模块错误,那就缺啥装啥。
三、验证环境
1.验证基础环境
安装完成后可以使用 python 进入 python 解释器,输入import paddle
,再输入 paddle.utils.run_check()
,如果出现PaddlePaddle is installed successfully!,说明已成功安装。
2.图片测试
下载PaddleOCR代码,写一个test.py文件,对图片进行文字识别。
from paddleocr import PaddleOCR, draw_ocr
# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch") # need to run only once to download and load model into memory
#修改为自己的图片路径
img_path = './doc/imgs/11.jpg'
result = ocr.ocr(img_path, cls=True)
for idx in range(len(result)):
res = result[idx]
for line in res:
print(line)
# 显示结果
from PIL import Image
result = result[0]
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores, font_path='./fonts/simfang.ttf')
im_show = Image.fromarray(im_show)
im_show.save('result.jpg')
如果遇到这种No module named ‘**’ 情况,使用 pip install ** -i https://pypi.tuna.tsinghua.edu.cn/simple
命令进行安装
测试结果如下:
遇到问题: 运行test.py提醒Could not locate zlibwapi.dll. Please make sure it is in your library path
解决步骤:
1.通过百度网盘下载zlibwapi.dll文件
链接:https://pan.baidu.com/s/1G3QINBLBaG9EiqQXqQmveg
提取码:byor
2.
将 zlibwapi.lib 文件放到 path/to/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v12.0/lib 下
将 zlibwapi.dll 文件放到 path/to/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v12.0/bin 下
这样就可以愉快的使用PaddleOCR训练自己的数据集了。