Atitit ocr的艺术 艾提拉著

 

目录

1. OCR可以说是一门非常“古老”的技术,在上世纪50年代到90年代, 1

1.1. 场景文字识别技术(Scene Text Recognition, STR), 1

2. Ocr的应用场景 2

2.1. 书籍录入 2

2.2. 图片分类,把文字性图片分离开 2

2.3. .OCR证件识别  Id身份证识别  身份证识别/表格识别 2

2.4. 车牌识别 2

2.5. .票据识别/银行卡识别/ 2

2.6. 名片识别,钞票冠字号 2

3. 一、OCR技术的发展历程 3

4. 方案选择 第三方api vs tesseract 3

5. Atitit  ocr识别原理 与概论 attilax总结 4

6. ref 4

 

 

 

  1. OCR可以说是一门非常“古老”的技术,在上世纪50年代到90年代,

关于它的研究出了很多成果。OCR识别是模式识别理论最成功的应用之一,发展到今天,针对文档扫描的OCR,在理论和应用方面,均非常成熟。

 

在OCR领域,目前的研究内容基本上集中在特种语言识别和手写识别领域(或两者相结合)。

 

    1. 场景文字识别技术(Scene Text Recognition, STR),

在STR领域,目前的研究遇到相当大的阻力。受制于自然场景中的多种图像退化以及多变的字体和风格等因素,STR的识别率一直较低。目前STR领域主要的研究思路有两种。其一是改进传统OCR中的方法,沿用文本检测->文本分割->字符识别这三个步骤来进行。其实际研究内容基本上集中在文本检测与分割上。 另一种思路则是将场景文本视为一种特殊的'物体,通过引入object recognition领域的方法来进行场景文本的识别,这一思路的主要问题是模型复杂,计算量大

 

STR算是新技术,跟OCR的最主要区别在于,一些文档识别中常用且有效的方法在自然场景中根本不work(比如基于分割的方法等)。我想无论是检测还是识别,主要的瓶颈无非源自于两个方面:

1)分类性能和检测速度。分类性能遇到的问题主要来自于分类器本身以及表示模型(Representation model),近两年的主流做法是暴力的使用CNN,但是目前来看,虽然进步巨大,但仍有不少潜力可挖。

2)检测速度的提升则依赖于一些启发式的算法,对于检测问题而言,经典的方法如MSER,SWT都可以看做是对检测速度的优化。但这些启发式算法往往不可避免的造成一些漏检(类比通用物体检测中的Objectness)。如何提出更适合文字的Proposal算法是一个非常有前途的研究方

  1. Ocr的应用场景
    1. 书籍录入
    2. 图片分类,把文字性图片分离开
    3. .OCR证件识别  Id身份证识别  身份证识别/表格识别 

2OCR证件识别又分:驾驶证识别、行驶证识别、身份证识别

 

    1. 车牌识别
    2. .票据识别/银行卡识别/
    3. 名片识别,钞票冠字号

 

  1. 一、OCR技术的发展历程

OCR(Optical Character Recognition)的概念诞生于1929年,由德国的科学家Tausheck首先提出,并且申请了专利。几年后,美国科学家Handel也提出了对文字进行识别的想法,但这种梦想直到计算机诞生后才变成为现实。现在这一技术已经由计算机来实现,OCR的意思也就演变成为利用光学技术对文字和字符进行扫描识别,并将其转化为计算机内码。

据记载,第一个OCR软件是在1957年开发的ERA(Electric Reading Automation)。它是基于窥视孔方法实现的,识别的速度是每秒120个英文字母。在此以后,世界范围内广泛地进行着OCR技术的研究和开发工作。从OCR技术的发展历程来看,可分为三个阶段:

第一阶段:第一代OCR产品出现于60年代初期,NCR公司、Farrington公司、IBM公司分别研制出了自己的OCR软件。最早的OCR产品应该是IBM公司的IBM1418。它只能识别印刷体的数字、英文字母及部分符号,并且必须是指定的字体。

第二阶段:第二代OCR产品是基于手写体字符的识别,前期只限于手写体数字的识别,从时间上来看,是60年代中期到70年代初期。IBM公司于1965年便在“纽约世界博览会”上展出了其OCR产品-IBM1287。第一个实现手写体邮政编码识别的信函自动分拣系统是由日本东芝公司研制的,两年后NEC公司也推出了同样的系统。到1974年,信函的分拣率达到92%~93%,并且广泛地应用在现实生活中,发挥着较好的作用。

第三阶段:第三代OCR产品主要解决的技术问题就是对于质量较差的文档及大字符集的识别,例如汉字的识别。最先投入汉字识别研究的日本东芝公司,于1983年发布了其识别印刷体日文汉字的OCR系统-OCR-V595,其识别速度为每秒70~100个汉字,最高识别率达到99.5%。

 

  1. 方案选择 第三方api vs tesseract 

有很多种方法可以实现,比如人民币玩家的可以接第三方:聚合、阿里、腾讯.......等等众多平台都有相关的方案,

平民玩家的,也有插件:tesseract 但是需要FQ下载,我这两天翻不了墙,我就不试了,百度大把大把的教程,但是平民玩家会麻烦一点,这是肯定的,我思考了一下,还是用第三方的吧,简单粗暴点

我选择的是聚合数据OCR,https://www.juhe.cn/docs/api/id/287

 

  1. Atitit  ocr识别原理 与概论 attilax总结

 

1.1. Ocr的过程与流程 1

1.2. OCR不同技术细分略有不同,但大概原理是一样的。 即主要技术过程是:二值化(又叫归一化)--------行定位----------字符切分----------字库模型比对(取置信度较高字)---------输出 2

1.3. 刚好现在在公司做OCR和STR, 现在主流的方法是CNN(基于featuremap的文字检测)+lstm(任意序列的文字行识别) 2

1.4. Tesseract 图片布局分析 字符分割和识别 2

1.5. 印刷汉字识别的过程主要包括: 3

1.6. 字符识别: 这一研究,已经是很早的事情了,比较早有模板匹配,后来以特征提取为主 4

 

  1. ref

 

 

OCR技术简介 - 云+社区 - 腾讯云.html

(9+条消息)Opencv实现身份证OCR识别 - 落日流年 - CSDN博客.html

Atiitt 常见gui ocr模式解决方案.docx

Atiti ocr字符相似度的计算.docx

Atiti ocr字符相似度的计算.docx.txt

Atitit  ocr识别原理 与概论 attilax总结.docx

Atitit  ocr识别原理 与概论 attilax总结.docx.lnk

Atitit  ocr识别原理 与概论 attilax总结.docx.txt

Atitit evernote  docroot.docx

Atitit ocr的艺术 艾提拉著.docx

Atitit ocr的艺术 艾提拉著.docx.lnk

Atitit wechat w1 fav url ocr txt bek stat.docx

Atitit 使用js nodejs进行图像处理ocr的解决方案attilax总结 - 副本.docx

Atitit 使用js nodejs进行图像处理ocr的解决方案attilax总结.docx

Atitit 全文搜索方面解决方案(分词,文本分类,pdf,office与 压缩文件的全文检索,图片的ocr检索.docx

Atitit 全文搜索方面解决方案(分词,文本分类,pdf,office与 压缩文件的全文检索,图片的ocr检索.docx.txt

Atitit 图像分类,通过ocr识别汉字图片.docx

Atitit 图像分类,通过ocr识别汉字图片.docx.lnk

Atitit 图像处理ocr的流程.docx

Atitit 图像处理ocr的流程.docx.lnk

Atitit 图文识别图片ocr au.docx

Atitit 图文识别图片ocr au.docx.txt

Atitit 图片图像文档的处理 分类  ocr压缩.docx

Atitit 常见的政体  民主(democracy);⒉贵族(aristocracy);⒊君主(monarchy).docx

Atitit 手写文字ocr识别与人脸识别的原理就是分类大法啊.docx

Atitit 手写文字ocr识别与人脸识别的原理就是分类大法啊.docx.txt

Atitit 手机浏览器收藏夹导出解决方案 ocr node.js js版本.docx

Atitit 脱机ocr手写文字识别解决方案.docx

Atitit 脱机ocr手写文字识别解决方案.docx.txt

Atitit 英文 阿拉伯文 单词作为基本的识别单位的ocr解决方案.docx

Atitit 英文 阿拉伯文 单词作为基本的识别单位的ocr解决方案.docx.txt

ocr.txt

新建文件夹