Atitit ocr的艺术艾提拉著目录 1. OCR可以说是一门非常“古老”的技术，在上世纪50年代到90年代， 1 1.1. 场景文字识别技术(Scene Text Recognition,

在STR领域，目前的研究遇到相当大的阻力。受制于自然场景中的多种图像退化以及多变的字体和风格等因素，STR的识别率一直较低。目前STR领域主要的研究思路有两种。其一是改进传统OCR中的方法，沿用文本检测->文本分割->字符识别这三个步骤来进行。其实际研究内容基本上集中在文本检测与分割上。另一种思路则是将场景文本视为一种特殊的'物体，通过引入object recognition领域的方法来进行场景文本的识别，这一思路的主要问题是模型复杂，计算量大

STR算是新技术，跟OCR的最主要区别在于，一些文档识别中常用且有效的方法在自然场景中根本不work（比如基于分割的方法等）。我想无论是检测还是识别，主要的瓶颈无非源自于两个方面：

1）分类性能和检测速度。分类性能遇到的问题主要来自于分类器本身以及表示模型（Representation model)，近两年的主流做法是暴力的使用CNN，但是目前来看，虽然进步巨大，但仍有不少潜力可挖。

2）检测速度的提升则依赖于一些启发式的算法，对于检测问题而言，经典的方法如MSER,SWT都可以看做是对检测速度的优化。但这些启发式算法往往不可避免的造成一些漏检（类比通用物体检测中的Objectness)。如何提出更适合文字的Proposal算法是一个非常有前途的研究方

Ocr的应用场景
1. 书籍录入
2. 图片分类，把文字性图片分离开
3. .OCR证件识别 Id身份证识别 身份证识别/表格识别

2OCR证件识别又分：驾驶证识别、行驶证识别、身份证识别

1. 车牌识别
2. .票据识别/银行卡识别/
3. 名片识别，钞票冠字号

一、OCR技术的发展历程

OCR（Optical Character Recognition）的概念诞生于1929年，由德国的科学家Tausheck首先提出，并且申请了专利。几年后，美国科学家Handel也提出了对文字进行识别的想法，但这种梦想直到计算机诞生后才变成为现实。现在这一技术已经由计算机来实现，OCR的意思也就演变成为利用光学技术对文字和字符进行扫描识别，并将其转化为计算机内码。

据记载，第一个OCR软件是在1957年开发的ERA（Electric Reading Automation）。它是基于窥视孔方法实现的，识别的速度是每秒120个英文字母。在此以后，世界范围内广泛地进行着OCR技术的研究和开发工作。从OCR技术的发展历程来看，可分为三个阶段：

第一阶段：第一代OCR产品出现于60年代初期，NCR公司、Farrington公司、IBM公司分别研制出了自己的OCR软件。最早的OCR产品应该是IBM公司的IBM1418。它只能识别印刷体的数字、英文字母及部分符号，并且必须是指定的字体。

第二阶段：第二代OCR产品是基于手写体字符的识别，前期只限于手写体数字的识别，从时间上来看，是60年代中期到70年代初期。IBM公司于1965年便在“纽约世界博览会”上展出了其OCR产品－IBM1287。第一个实现手写体邮政编码识别的信函自动分拣系统是由日本东芝公司研制的，两年后NEC公司也推出了同样的系统。到1974年，信函的分拣率达到92％～93％，并且广泛地应用在现实生活中，发挥着较好的作用。

第三阶段：第三代OCR产品主要解决的技术问题就是对于质量较差的文档及大字符集的识别，例如汉字的识别。最先投入汉字识别研究的日本东芝公司，于1983年发布了其识别印刷体日文汉字的OCR系统－OCR-V595，其识别速度为每秒70～100个汉字，最高识别率达到99.5％。

方案选择第三方api vs tesseract

有很多种方法可以实现，比如人民币玩家的可以接第三方：聚合、阿里、腾讯.......等等众多平台都有相关的方案，

平民玩家的，也有插件：tesseract 但是需要FQ下载，我这两天翻不了墙，我就不试了，百度大把大把的教程，但是平民玩家会麻烦一点，这是肯定的，我思考了一下，还是用第三方的吧，简单粗暴点

我选择的是聚合数据OCR，https://www.juhe.cn/docs/api/id/287

Atitit ocr识别原理与概论 attilax总结

1.1. Ocr的过程与流程 1

1.2. OCR不同技术细分略有不同，但大概原理是一样的。即主要技术过程是：二值化（又叫归一化）--------行定位----------字符切分----------字库模型比对（取置信度较高字）---------输出 2

1.3. 刚好现在在公司做OCR和STR, 现在主流的方法是CNN（基于featuremap的文字检测）+lstm（任意序列的文字行识别） 2

1.4. Tesseract 图片布局分析字符分割和识别 2

1.5. 印刷汉字识别的过程主要包括： 3

1.6. 字符识别：这一研究，已经是很早的事情了，比较早有模板匹配，后来以特征提取为主 4

ref

OCR技术简介 - 云+社区 - 腾讯云.html

(9+条消息)Opencv实现身份证OCR识别 - 落日流年 - CSDN博客.html

Atiitt 常见gui ocr模式解决方案.docx

Atiti ocr字符相似度的计算.docx

Atiti ocr字符相似度的计算.docx.txt

Atitit ocr识别原理与概论 attilax总结.docx

Atitit ocr识别原理与概论 attilax总结.docx.lnk

Atitit ocr识别原理与概论 attilax总结.docx.txt

Atitit evernote docroot.docx

Atitit ocr的艺术艾提拉著.docx

Atitit ocr的艺术艾提拉著.docx.lnk

Atitit wechat w1 fav url ocr txt bek stat.docx

Atitit 使用js nodejs进行图像处理ocr的解决方案attilax总结 - 副本.docx

Atitit 使用js nodejs进行图像处理ocr的解决方案attilax总结.docx

Atitit 全文搜索方面解决方案（分词，文本分类，pdf，office与压缩文件的全文检索，图片的ocr检索.docx

Atitit 全文搜索方面解决方案（分词，文本分类，pdf，office与压缩文件的全文检索，图片的ocr检索.docx.txt

Atitit 图像分类，通过ocr识别汉字图片.docx

Atitit 图像分类，通过ocr识别汉字图片.docx.lnk

Atitit 图像处理ocr的流程.docx

Atitit 图像处理ocr的流程.docx.lnk

Atitit 图文识别图片ocr au.docx

Atitit 图文识别图片ocr au.docx.txt

Atitit 图片图像文档的处理分类 ocr压缩.docx

Atitit 常见的政体民主（democracy）；⒉贵族（aristocracy）；⒊君主（monarchy）.docx

Atitit 手写文字ocr识别与人脸识别的原理就是分类大法啊.docx

Atitit 手写文字ocr识别与人脸识别的原理就是分类大法啊.docx.txt

Atitit 手机浏览器收藏夹导出解决方案 ocr node.js js版本.docx

Atitit 脱机ocr手写文字识别解决方案.docx

Atitit 脱机ocr手写文字识别解决方案.docx.txt

Atitit 英文阿拉伯文单词作为基本的识别单位的ocr解决方案.docx

Atitit 英文阿拉伯文单词作为基本的识别单位的ocr解决方案.docx.txt

ocr.txt

新建文件夹

上一篇：Atitit 2018 技术趋势与没落技术总结目录 1. 2018 技术雷达 1 1.1. HOSTED IDENTITY MANAGEMENT AS A SERVICE （SaaS）身份管理

下一篇：Atitit 知识发现艾提拉总结目录 1. 知识发现 1 1.1. 与数据挖掘的区别与联系数据挖掘

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

Atitit ocr的艺术 艾提拉著 目录 1. OCR可以说是一门非常“古老”的技术，在上世纪50年代到90年代， 1 1.1. 场景文字识别技术(Scene Text Recognition,

Atitit ocr的艺术 艾提拉著 目录 1. OCR可以说是一门非常“古老”的技术，在上世纪50年代到90年代， 1 1.1. 场景文字识别技术(Scene Text Recognition,

51CTO博客

Atitit ocr的艺术艾提拉著目录 1. OCR可以说是一门非常“古老”的技术，在上世纪50年代到90年代， 1 1.1. 场景文字识别技术(Scene Text Recognition,

Atitit ocr的艺术艾提拉著目录 1. OCR可以说是一门非常“古老”的技术，在上世纪50年代到90年代， 1 1.1. 场景文字识别技术(Scene Text Recognition,