图像识别学习图像识别怎么学

关注 mob6454cc76bc4a

图像识别学习图像识别怎么学

转载

mob6454cc76bc4a 2024-03-30 17:58:02

文章标签 图像识别学习图像识别颜色空间预处理图像处理 文章分类 计算机视觉人工智能

一机器视觉的开发流程

1	相机，镜头，光源的选型
2	对相机的开发(图像的采集)
3	对图像的处理
4	与外围设备的协同工作(如机器人)

【注】 1.图像识别是机器视觉第三步要做的工作

2.图像识别中有一种最常用的场景就是OCR(Optical Character Recognition,光学字符识别),就是识别字符，这种有一些开源的库可以选择，比较著名的就是Tesseract

识别原理：图片分为位图与矢量图，前者是根据像素拼在一起的，后者是根据算法生成的。既然是根据算法，矢量图在任何分辨率下都不会失真。而像素就不行了。图像识别只能针对位图进行处理，根据算法操作像素，来找到我们的目标图案，然后根据模板进行匹配。

二图像处理思路

获取图像	图像采集可以来源多个途径，用算子read_image去读取图像文件；用相机助手，可读取单个或多个相机视频；使用读文件或读取路径（可用tuple实现读取多个图像文件）助手。其中，使用相机助手获取相机图像最为常用。 Halcon通过ImageAcquisition Interfaces对各种图像采集卡及各种工业相机进行支持。其中包括：模拟视频信号，数字视频信号Camera Link,数字视频信号IEEE 1394,数字视频信号USB2.0,数字视频信号Gigabit Ethernet等。 Halcon通过统一的接口封装上述不同相机的image acquisition interfaces,从而达到算子统一化。不同的相机只需更改几个参数就可变更使用。 Halcon图像获取的思路：1、打开设备，获得该设备的句柄。2、调用采集算子，获取图像。
图像颜色空间变换	颜色的定义，颜色是光作用于人眼引起除形象以外的视觉特性。计算机常用的颜色空间主要有两种，RGB和HSV。RGB颜色空间，主要是依据人眼的生理结构，人眼有三类视锥体细胞，分别是红，绿，蓝。而HSV颜色空间，是基于颜色本身的属性，H代表色相，主要由波长决定；S代表纯度，取决于峰值能量与其他频段能量白色光的比例；V代表亮度。H与S属性，常常会混为一谈，是为颜色的色度特性。阈值进行分割时，常常可以将RGB颜色空间转换到HSV颜色空间，去观察图像的色相以及饱和度属性。
图像预处理	图像预处理，即对采集的图像不是很满意，以致于会影响后续图像处理的结果，因此必须对采集的图像进行预处理。图像预处理，并未对图像做出实质性的提取和改变，主要是以滤波、增强对比度等改善图像质量为目的。图像的点运算（即操作直方图），图像的几何变换、图像的增强处理以及图像的正交变换。点运算，主要用于改变一幅图像的灰度分布范围；图像的几何变换，主要包括图像的平移变换、镜像变换、图像的转置、缩放和旋转等内容；图像的增强处理，主要对图像的噪声过滤以及对比度增强，即平滑、锐化处理；图像的正交变换，主要包括傅里叶变换、哈达玛变换、离散余旋变换以及K-L变换等，将信号从空间域变换到空间频域，以便于更好的处理信号。
区域及轮廓提取（提取ROI）	区域以及轮廓的提取，即提取ROI，这一步是整个图像处理软件中的核心步骤。就我目前的知识水平大致可分为三个方法：Blob分析，模板匹配以及机器学习识别模式。 Blob分析的基本思想，通过其灰度值的差别来识别图像中前景的像素。Blob分析三兄弟，图像分割，图像形态学处理，特征提取。模板匹配，主要包括形状匹配以及灰度值匹配。关键步骤，创建模板；在图像中查找模板。机器学习识别，基于多层感知的自我训练，通过监督学习，形成分类器。主要分为四步，创建trf训练文件（绑定字符图像与字符），创建神经分类器，训练分类器，将分类器保存为ocm文件（即可用于识别）。
图像识别及诊断（或要进行相机标定）

三图像处理的工具

名称	说明
Halcon
openCV	官网已经有了java和python支持的库，如果用c#还需要使用openCVSharp,这样的第三方制作的库。
Matlab
Labview
visionPro

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：代码获取spring requestbody 代码获取手机号

下一篇：java的无限循环怎么写 java中无限循环语句

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

直播训练营

鸿蒙开发者社区

WOT技术大会

AIGC创新中国行

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 2024年软考 PMP项目管理软考资讯

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO题库小程序

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO博客

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册