手机随时阅读
新人专享大礼包¥24
在今天的文章中,我们将学习如何使用名为Tesseract和OpenCV的开源工具识别图像中的文本。从图像中提取文本的方法也称为光学字符识别(OCR)或有时简称为文本识别。Tesseract是由HewlettPackardLabs开发的专有软件。2005年,惠普与内华达拉斯维加斯大学合作开源。自2006年以来,它一直由谷歌和许多开源贡献者积极开发。当Tesseract开始支持许多图像格式并逐渐添加大
本文将描述一类称为图像修复的区域填充算法。想象一下找一张旧的家庭照片。你扫描它,它看起来很棒,除了一些划痕。当然,你可以在photoshop中加载照片并修复划痕。除此之外可以编写10行代码以使用OpenCV中的修复算法来解决问题。1什么是图像修复图像修复是计算机视觉中的一类算法,其目标是填充图像或视频内的区域。该区域使用二进制掩模进行标识,填充通常根据需要填充的区域边界信息来完成。图像修复的最常见
1什么是霍夫变换霍夫变换是用于检测图像中的简单形状(诸如圆形,线条等)的特征提取方法。“简单”形状是可以仅由几个参数表示的形状。例如,一条线可以用两个参数(斜率,截距)表示,一个圆有三个参数:中心坐标和半径(x,y,r)。霍夫变换在图像中找到这样的形状方面做得很好。使用Hough变换的主要优点是它对遮挡不敏感。让我们通过一个例子来看看霍夫变换是如何工作的。1.1应用霍夫变换以检测图像中的线条极坐标
!https://s4.51cto.com/images/blog/202205/06200710_62750f6e0c8c397874.jpg?xossprocess=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=
在本文中,我们会看到如何将一个三角形仿射变换到另一个三角形。在图形学的研究中,研究者常常进行三角形之间的变换操作,因为任意的3D表面都可以用多个三角形去近似表示。同样的,图像也可以分解成多个三角形来表示。但是在OpenCV中并没有直接将三角形仿射变换成另一个三角形的函数。本教程将逐步说明如何将下图中左图中的三角形转换为右图。!https://s4.51cto.com/images/blog/202
在本教程中,我们将学习如何填充二值图像中的孔。考虑下图左侧的图像。假设我们想要找到一个二值掩模,它将硬币与背景分开,如下图右侧图像所示。在本教程中,包含硬币的圆形区域也将被称为前景。!https://s4.51cto.com/images/blog/202205/04111046_6271eeb688d5648103.jpg?xossprocess=image/watermark,size_14,
在本教程中,我们将学习如何完全自动地从照片中消除红眼。如下图所示:!https://s4.51cto.com/images/blog/202205/03222809_62713bf93874781673.jpg?xossprocess=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,sh
有很多很棒的GUI库,例如Qt和imgui,可以与OpenCV一起使用,允许您在运行时调整参数。但是,在某些情况下,您可能没有(或不希望)此类库的依赖关系,例如,您没有使用Qt支持编译OpenCV,或者您无法使用OpenGL。在这种情况下,您只需要一种快速,轻松的方式来创建GUI来调整算法。这就是cvui的目的。它是一个基于OpenCV绘图基元构建的跨平台GUI库,仅需使用头文件就可以搭建。除了O
C11扩展了for语句的语法。用这个新写法forEach,forEach可以遍历C类型的数组、初始化列表以及任何重载了非成员的begin()和end()函数的类型。OpenCV的Mat数据结构中有用到ForEach的写法。在本教程中,我们将比较Mat类的forEach方法与OpenCV中访问和转换像素值的其他方法的性能。我们将展示forEach如何比使用at方法或甚至有效地使用指针算法更快。因此本
本教程中,我们将了解目标检测中称为“选择性搜索”的重要概念。我们还将在OpenCV中使用C和Python实现该算法。1背景1.1目标检测与目标识别目标识别算法TargetRecognition识别图像中存在哪些对象。它将整个图像作为输入,并输出该图像中存在的对象的类标签和类概率。例如,类标签可以是“狗”,相关的类概率可以是97%。另一方面,目标检测算法TargetDetection不仅告诉您图像中
!https://s4.51cto.com/images/blog/202204/28113250_626a0ae28d04445171.jpg?xossprocess=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=
本教程中,我们将了解使用OpenCV的ExposureFusion(曝光融合)。1什么是曝光融合曝光融合是一种将使用不同曝光设置拍摄的图像合成为一张看起来像色调映射的高动态范围(HDR)图像的图像的方法。当我们使用相机拍摄照片时,每个颜色通道只有8位来表示场景的亮度。然而,我们周围世界的亮度理论上可以从0(黑色)到几乎无限(直视太阳)。因此,傻瓜相机或移动相机根据场景决定曝光设置,以便使用相机的动
在本教程中,我们将学习如何使用不同曝光设置拍摄的多张图像创建高动态范围图像(HDR)。1背景1.1什么是高动态范围(HDR)成像?大多数数码相机和显示器将彩色图像捕获或显示为24位矩阵。每个颜色通道有8位,一共三个通道,因此每个通道的像素值在0到255之间。换句话说,普通相机或显示器具有有限的动态范围。然而,我们周围的世界颜色有一个非常大的变化范围。当灯关闭时,车库会变黑;太阳照射下,车库看起来变
在这篇文章中,我们将学习如何使用EigenFaces实现人脸重建。我们需要了解主成分分析(PCA)和EigenFaces。1背景1.1什么是EigenFaces?在我们之前的文章中,我们解释了Eigenfaces是可以添加到平均(平均)面部以创建新的面部图像的图像。我们可以用数学方式写这个,!https://s4.51cto.com/images/blog/202204/25190552_6266
在这篇文章中,我们将学习Eigenface(特征脸),主成分分析(PCA)在人脸中的应用。1PCA美国人口约为3.25亿。你可能认为数百万人会有一百万种不同的想法,观点和想法,毕竟每个人都是独一无二的。对吗?错误!人类就像绵羊。我们跟着一群人。这很可悲但却是真实的。假设您在美国选择了20个最重要的政治问题,并要求数百万人使用“是”或“否”来回答这些问题。这里有一些例子:1.你支持枪支控制吗?1.你
!https://s4.51cto.com/images/blog/202204/23235122_6264207a24c7472649.jpg?xossprocess=image/watermark,size_14,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=
在这篇文章中,我们将学习如何使用OpenCV执行基于特征的图像对齐。我们将使用移动电话拍摄的表格的照片与表格的模板对齐。我们将使用的技术通常被称为“基于特征图像对齐”,因为在该技术中,在一个图像中检测稀疏的特征集并且在另一图像中进行特征匹配。然后基于这些匹配特征将原图像映射到另一个图像,实现图像对齐。如下图所示:!https://s4.51cto.com/images/blog/202204/22
《圣经》记载,当时人类联合起来兴建希望能通往天堂的高塔;为了阻止人类的计划,上帝让人类说不同的语言,使人类相互之间不能沟通,计划因此失败。像“Homography”这样的术语经常提醒我,我们仍然在与沟通斗争。Homography(单应性)是一个简单的概念,却有一个奇怪的名字!1介绍1.1什么是Homography考虑图1所示的同一个平面(比如书皮)的两幅图像。红点表示两幅图像中相同的物理坐标点。在
技术有时会提高艺术,但有时也会破坏艺术。着色黑白电影是一个可以追溯到1902年的古老想法。几十年来,许多电影创作者反对将黑白电影着色的想法,并将其视为对艺术的破坏。但今天它被接受为艺术形式的增强。该技术本身已经从艰苦的手工着色转变为如今的自动化技术。如下图所示。!https://s4.51cto.com/images/blog/202204/20090355_625f5bfb18adc57175.
在这篇文章中,我们将介绍如何在OpenCV中使用MultiTracker类实现多目标跟踪API。在深入了解详细信息之前,请查看下面列出的关于目标跟踪的帖子,以了解在OpenCV中实现的单个目标跟踪器的基础知识。同时需要安装opencv_contrib库,详细见:1背景介绍计算机视觉和机器学习的大多数初学者都学习对象检测。如果您是初学者,您可能会想到为什么我们需要对象跟踪。我们不能只检测每一帧中的物
在这篇文章中,我们将学习一种基于深度学习的目标跟踪算法GOTURN。GOTURN在Caffe中搭建,现在已移植到OpenCVTrackingAPI,我们将使用此API在C和Python中使用GOTURN。1什么是对象跟踪和GOTURN对象跟踪的目标是跟踪视频序列中的对象。使用视频序列的帧和边界框初始化跟踪算法,以获得我们感兴趣的对象的位置。跟踪算法输出所有后续帧的边界框。有关对象跟踪的更多详细信息
MaskRCNN具体内容见:MaskRCNN最初于2017年11月由Facebook的AI研究团队使用Python和Caffe2推出。工程代码见:后来MaskRCNN被移植到Tensorflow,并且在共享了几个预先训练的模型,这些模型具有不同的训练架构,如InceptionV2,ResNet50,ResNet101和InceptionResnetV2。它们还为您提供培训自己模型的工具。基于Inc
手部关键点检测是在手指上找到关节以及在给定图像中找到指尖的过程。它类似于在脸部(面部关键点检测)或身体(人体姿势估计)上找到关键点。但是手部检测不同的地方在于,我们将整个手部视为一个对象。美国卡耐基梅隆大学智能感知实验室(CMUPerceptualComputingLab)发布了手的关键点检测模型。详情见:我们将在本文介绍如何调用该模型。1背景!https://s4.51cto.com/image
在这篇文章中,我们将展示如何使用HuMoments进行形状匹配。您将学习以下内容什么是图像矩?如何计算图像矩?什么是图像矩不变量(或胡时刻)?如何使用OpenCV计算图像的Hu图像矩?如何使用Hu图像矩来找到两个形状之间的相似性。1什么是图像矩?图像矩是图像像素强度的加权平均值。让我们选择一个简单的例子来理解。为简单起见,我们考虑单通道二进制图像I。位置处的像素强度(X,Y)为I(X,Y)。二进制
在中学,我们学习了几何的中各种平面图形。找到标准平面图形的中心(几何中心)比较容易,如圆形,方形,三角形,椭圆形等。中心是几何名词,质心是物理名词。质心是针对实物体而言的,而几何中心是针对抽象几何体而言的,对于密度均匀标准形状的物体,质心和几何中心重合。但是当要找到任意形状的质心时,就不那么容易了。在处理图像时,很多时候需要找到质心。在这篇文章中,我们将首先讨论如何找到任意形状blob的质心,然后
YOLOv3是计算机视觉中最受欢迎的实时目标检测器之一。在这个循序渐进的教程中,我们从如何使用YOLOv3训练1类物体探测器的简单案例开始。本教程是以初学者为中心编写的。建立自己的雪人检测器。在这篇文章中,我们将分享训练过程,有助于训练的脚本以及一些公开的雪人图像和视频。您可以使用相同的过程来训练具有多个对象的对象检测器。特别要注意的是,训练yolov3最好在linux下进行,同时所有涉及到输入路
目录在这篇文章中,我们将学习如何使用OpenCV库中称为特征点匹配的技术以实现简单视频稳定稳像。我们将讨论该算法并共享代码,以便在OpenCV中使用此方法设计一个简单的稳定器,最好OpenCV3.4.3以上实现代码。什么是视频稳定,视频稳定是指用于减少相机运动对最终视频影响的一系列方法,理解成消除视频抖动就行了。见下图通常用拍摄会出现轻微的抖动,比如手机拍摄视频,后期需要对其进行视频稳像操作。!h
在这篇文章中,我们将逐字逐句地尝试找到图片中的单词!基于最近的一篇论文进行文字检测。EAST:AnEfficientandAccurateSceneTextDetector.应该注意,文本检测不同于文本识别。在文本检测中,我们只检测文本周围的边界框。但是,在文本识别中,我们实际上找到了框中所写的内容。例如,在下面给出的图像中,文本检测将为您提供单词周围的边界框,文本识别将告诉您该框包含单词STOP
Copyright © 2005-2022 51CTO.COM 版权所有 京ICP证060544号