iNeuKernel.Ocr图像数据采集软件,实现了实时自动获得屏幕截图或是应用程序截图、动态增加数据识别标签信息、后台任务自动切片采集数据以及实时转发数据,与iNeuOS工业互联网操作系统互联互通,完整数据采集、传输、存储、视图建模、分析等应用过程。

目       录

1..... 应用概述... 2

2..... 免费下载试用... 2

3..... 视频介绍... 2

4..... iNeuLink.Ocr图像数据采集应用... 2

5..... 数据上传到iNeuOS工业互联网操作系统... 4

6..... Ocr基本概念... 7


1.   应用概述


  在工业、军工或航天等领域,有些设备及软件系统比较陈旧,但是更换的成本比较高,在实验或生产过程中不能够完整的记录数据,给数据应用和分析造成了很大的障碍,更无法解决实验和生产人员的劳动强度

  通过OCR图像识别的技术可以很好的解决上述问题,但是没有一个完整的产品化的软件实现操作级应用。尽管OCR技术相对比较成熟,除特定应用场景使用外,普及使用率并不高。

  iNeuKernel.Ocr图像数据采集软件,实现了实时自动获得屏幕截图或是应用程序截图、动态增加数据识别标签信息、后台任务自动切片采集数据以及实时转发数据,与iNeuOS工业互联网操作系统互联互通,完整数据采集、传输、存储、视图建模、分析等应用过程。示意如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_数据


2.   免费下载试用


  链接:​​https://pan.baidu.com/s/1joGfBefaBKiFJ1l08N3KZg​

  提取码:v242


3.   视频介绍


   视频介绍:​​iNeuKernel.Ocr 图像数据识别与采集​


4.   iNeuLink.Ocr图像数据采集应用


(1)运行的主界面,应用相对简单。如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_数据采集_02

  (2)配置图源,可以使用快捷键,全屏截图或是程序截图,以便定位数据标签的坐标的相对位置,进行数据提取。如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_数据_03

  (3)增加或编辑识别标签,单击【数据识别】可以用红色方框在图源上标注要误别的数据位置信息,在【数据识别结果】中可以看到识别数据的结果,并且填写数据标签名称。如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_数据_04

  (4)转发数据,可以把识别的数据结果转发给其他系统,填写站点编号、远程IP、远程Port转发周期和是否启用等信息。如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_数据采集_05


5.   数据上传到iNeuOS工业互联网操作系统


  下载iNeuOS离线安装包,安装过程参见:​​一键部署​​。进入系统后,选择桌面【设备模型】,单击左上角小加号图标,增加一个新的设备。选择【服务实例】后面的【编辑】按钮链接,配置【基本设置】和【Socket】,【Socket】默认侦听端口为6699,其他信息一般不需要修改,如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_工业互联网_06

     选择配置好的【服务实例】,并且配置通讯类型、应用协议和选择驱动等,配置如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_工业互联网_07

     选择左上角旋转图标,会重新启动后台服务,应用当前配置好的信息。硬件网关与iNeuOS平台第一次通信时会同步网关的设备和数据点信息,会在当前iNeuOS设备驱动下生成子设备,在子设备上会有iNeuKernel硬件网关的数据点信息。如下图:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_工业互联网_08

    iNeuOS工业互联网试用:​​试用地址​


6.   Ocr基本概念


 (1)OCR的应用场景

   根据OCR的应用场景而言,我们可以大致分成识别特定场景下的专用OCR以及识别多种场景下的通用OCR。就前者而言,证件识别以及车牌识别就是专用OCR的典型案例。针对特定场景进行设计、优化以达到最好的特定场景下的效果展示。那通用的OCR就是使用在更多、更复杂的场景下,拥有比较好的泛性。在这个过程中由于场景的不确定性,比如:图片背景极其丰富、亮度不均衡、光照不均衡、残缺遮挡、文字扭曲、字体多样等等问题,会带来极大的挑战。

 (2)OCR的技术路线

   典型的OCR技术路线如下图所示:

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_数据采集_09

   其中OCR识别的关键路径在于文字检测和文本识别部分,这也是深度学习技术可以充分发挥功效的地方。PaddleHub为大家开源的预训练模型的网络结构是Differentiable Binarization+ CRNN,基于icdar2015数据集下进行的训练。

   首先,DB是一种基于分割的文本检测算法。在各种文本检测算法中,基于分割的检测算法可以更好地处理弯曲等不规则形状文本,因此往往能取得更好的检测效果。但分割法后处理步骤中将分割结果转化为检测框的流程复杂,耗时严重。因此作者提出一个可微的二值化模块(Differentiable Binarization,简称DB),将二值化阈值加入训练中学习,可以获得更准确的检测边界,从而简化后处理流程。DB算法最终在5个数据集上达到了state-of-art的效果和性能。参考论文:​​Real-time Scene Text Detection with Differentiable Binarization​

   下图是DB算法的结构图:


[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_数据采集_10


  接着,我们使用 CRNN(Convolutional Recurrent Neural Network)即卷积递归神经网络,是DCNN和RNN的组合,专门用于识别图像中的序列式对象。与CTC loss配合使用,进行文字识别,可以直接从文本词级或行级的标注中学习,不需要详细的字符级的标注。参考论文:​​An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition​

   下图是CRNN的网络结构图:


[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_数据采集_11


物联网&大数据技术 QQ群:54256083

物联网&大数据项目 QQ群:727664080

微信公众号:iNeuOS

[免费下载应用]iNeuKernel.Ocr 图像数据识别与采集的产品化应用_数据_12