前言

OCR图片转文字识别软件,完全离线。截屏/批量导入图片,支持多国语言、合并段落、竖排文字。可排除水印区域,提取干净的文本。基于 PaddleOCR 。

安装步骤

Umi-OCR v2 激活版:Umi-OCR_Paddle_v2.1.2.zip

1、解压后将Umi-OCR.exe发送到桌面快捷方式

image.png

2、点击桌面快捷方式

image.png

3、正常启用

image.png

二、使用步骤

1、以批量文档OCR识别为例,将图片型的pdf拖入到左侧

image.png

2、设置要转换的页数,默认是识别所有的,我这里选择特定页数(第4页),如下图,点击页数后会跳出弹出框进行设置。

image.png

3、设置排版解析方案,我试了下,选择【单栏-总是换行】效果会更好,后续解析入库方便

image.png

4、点击【开始任务】,任务执行结束后查看记录

image.png

总结

其他功能页感兴趣的小伙伴可以自己研究下,目前这个只有window版本,有一定的局限性,我目前用的项目场景是,用vue做个按钮触发一个.bat的脚本,然后将文件批量上传到这里,接着将解析后的文件进行解析入库