java ocr 中文 java开源ocr

转载

mob6454cc78b025 2023-06-09 14:39:17

文章标签 java ocr 中文 Java github 字符识别 文章分类 Java 后端开发

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；

现在有很多软件都支持这个功能，比如钉钉就支持扫描图片后直接转成文字。

现在有了Java包装的API了，那就是Tess4J (https://github.com/nguyenq/tess4j )

Tesseract是一个流行的OCR开源项目。通过Tess4J，我们可以访问Java中的Tesseract API。加载本机库和下载Tesseracts LSTM数据需要进行一些设置。之后在Java中很容易执行OCR。如果您对已识别的文本不满意，那么最好看看Tesseract文档的“提高输出质量”部分（https://tesseract-ocr.github.io/tessdoc/ImproveQuality.html ）。

<dependency>
    <groupId>net.sourceforge.tess4j</groupId>
    <artifactId>tess4j</artifactId>
    <version>4.5.3</version>
</dependency>

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：python根据series画柱状图 python画图柱状图

下一篇：java通过pid获取进程信息 java 获取进程信息

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

java ocr 中文 java开源ocr

java ocr 中文 java开源ocr

51CTO博客