pdf有转换,如果是非扫描的,转换很快,识别率100%,很多软件可以转;如果是扫描的,就比较麻烦需要用到OCR技术(文字识别)。在linux下:依赖包  poppler-utils  tesseract tesseract-ocr-chi-sim (包名可以通过yum search chi_sim 确定) 情况一:pdftotxt 命令 可以转换非扫描版,免
原创 2016-09-01 14:12:20
1559阅读