1. 基本概念1.1 TesseractTesseract 是一款基于 C 语言开发并开源的光学识别工具,提供底层的文字识别能力。1.2 Tess4JTess4J 是对 Tesseract OCR API 的 Java 封装,有了 Tess4J 之后 Java 就可以直接调用本地安装的 Tesseract 进行文字识别。2. 安装2.1 Tesseract 安装Tesseract 官方本身没有提供
最近在需求上有一个识别图片中的文字功能,查询了不少资料,发现可以使用tess4j识别图像文字:话不多说现在开始:首先创建Spring Boot项目:导入以下依赖net.sourceforge.tess4jtess4j3.2.1把下载好的中文识别包放入到tessdata包下好了现在来编写测试类======================================================