第一步:引入maven:
<dependency> <groupId>net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>3.2.1</version> </dependency>
第二步:
下载语言包:eng.traineddata ,在E盘下创建文件夹tessdata,并且将下载的 eng.traineddata 放在tessdata文件夹下
第三步:
编写代码测试:
public static String getImgText(String imageLocation) { ITesseract instance = new Tesseract(); instance.setDatapath("E:\\"); try { String imgText = instance.doOCR(new File(imageLocation)); return imgText; } catch (TesseractException e) { e.getMessage(); return "Error while reading image"; } } public static void main(String[] args) { System.out.println(getImgText("E:\\tessdata\\2.jpg")); }
结果: