从2013年的记录看,JAVA中图片文字识别技术大部分采用ORC的tesseract的软件功能,后来渐渐开放了java-api调用接口。

图片文字识别技术,还是采用训练的方法。并未从根本上解决图片与文字的关联关系。

什么是tesseract:

  tesseract是google的一个离线工具,用于图片的文字识别与提取。