1 感兴趣区域: ROI

在图像处理领域,我们常常需要设置感兴趣区域 ( ROI. region of interest) ,来专注或者简化工作过程 。 也就是从图像中选择的一个图像区域,这个区域是图像分析所关注的重点 。 我们圈定这个区域,以便进行进一步处理 。 而且,使用 ROI指定想读入的目标,可以减少处理时间,增加精度,给图像处理来带不小的便利 。

定义 ROI 区域有两种方法 :

第一种是使用表示矩形区域的 Rect。 它指定矩形的左上角坐标 ( 构造函数的前两个参数)和矩形的长宽(构造函数的后两个参数)以定义一个矩形区域 。

其中, image 为已经载入好的图片 。

//定义一个 Mat 类型并给其设定 ROI 区域
Mat imageROI ;
//方法一
imageROI =image(Rect( 500 , 250 , logo.cols , logo.rows ));

另 一种定义 ROI 的方式是指定感兴趣行或列的范围 ( Range ) 。 Range 是指从起始索引到终止索引(不包括终止索引)的一连段连续序列 。 cRange 可以用来定义 Range 。 如果使用 Range 来定义 ROI, 那么前例中定义 ROI 的代码可以重写为 :

//方法二
imageROI = image(Range(250 , 250+logoimage.rows) , Range (200 , 200+logoimage.cols )) ;

下面我们来看一个实例,显示如何利用 ROI 将一幅图加到另一幅图的指定位置 。

大家如果需要复制以下函数中的代码直接运行, 可以自已建一个基于 console的程序,然后把函数体中的内容复制到 main 函数中 ,然后找两幅大小合适的附片,加入到工程目录下,并和代码中读取的文件名 一致即可 。

//描述:利用感兴趣区域ROI实现图像叠加
bool ROI_AddImage()
{

// 【1】读入图像
Mat srcImage1= imread("D:\\QT\\project\\opencv_qtcreaor\\image\\dota_pa.jpg");
Mat logoImage= imread("D:\\QT\\project\\opencv_qtcreaor\\image\\dota_logo.jpg");
if( !srcImage1.data ) { qDebug()<<"读取srcImage1错误~! \n"<<endl; return false; }
if( !logoImage.data ) { qDebug()<<"读取logoImage错误~! \n"<<endl; return false; }

// 【2】定义一个Mat类型并给其设定ROI区域
Mat imageROI= srcImage1(Rect(200,250,logoImage.cols,logoImage.rows));

// 【3】加载掩模(必须是灰度图)
Mat mask= imread("dota_logo.jpg",0);

//【4】将掩膜拷贝到ROI
logoImage.copyTo(imageROI,mask);

// 【5】显示结果
namedWindow("<1>利用ROI实现图像叠加示例窗口");
imshow("<1>利用ROI实现图像叠加示例窗口",srcImage1);

return true;
}

这个函数首先是载入了两张 jpg 图片到 srclmage1和 logolmage 中,然后定义了 一个 Mat 类型 的 imageROI , 并使用 Rect 设置其感兴趣区域为 srcimage1中的一块区域 , 将 imageROI 和 srclmage1关联起来。接着定义了 一个 Mat 类型的 的 mask并读入 dota_ logo.jpg, 顺势使用 Mat: : copyTo 把 mask 中的内容复制到 imageROI中, 于是就得到了最终 的效果图 。 namedWindow 和 imshow 配合使用,显示出最终的结果 。

(OpenCV — 7)ROI 区域图像叠加&图像混合_权重

2 线性混合操作

线性混合操作是一种典型的二元(两个输入)的像素操作,它的理论公式如下 :

(OpenCV — 7)ROI 区域图像叠加&图像混合_数组_02

我们通过在范围 0 到 1 之间改变 alpha 值,来对两幅图像 ( f0(x)和 f1(x)) 或两段视频(同样为 f0(x)和 f1(x) ) 产生时间上的画面叠化 ( cross-dissolve ) 效果 ,就像幻灯片放映和电影制作中的那样 ,也就是在幻灯片翻页 时设置的前后页缓慢过渡叠加效果,以及电影情节过渡时经常出现的画面叠加效果。
实现方面 , 主要运用了 OpeoCV 中 addWeighted 函数 , 下面来一起全面地 了解它 。

3 计算数组加权和: addWeigbted()函数

void addWeighted(InputArray src1, 
double alpha,
InputArray src2,
double beta,
double gamma,
OutputArray dst,
int dtype = -1);

  • 第一个参数 , lnputArray 类型的 src1, 表示需要加权的第一个数组 , 常常填一个 Mat ;
  • 第二个参数 , double 类型的 alpha, 表示第一个数组的权重 ;
  • 第三个参数 , InputArray 类型的 src2, 表示第二个数组 , 它需要和第一个数组拥有相同的尺寸和通道数 :
  • 第四个参数 , double 类型的 beta, 表示第二个数组的权重值 ;
  • 第五个参数, double 类型的 gamma , 一个加到权重总和上的标量值 。 其含义通过接下来列出的式子自然会理解 ;
  • 第六个参数 , OutputArray 类型的 dst, 输出 的数组 , 它和输入的两个数组拥有相同的尺寸和通道数 ;
  • 第七个参数, int 类型的 dtype, 输出阵列的可选深度 , 有默认值- I 。当两个输入数组具有相同的深度时 , 这个参数设笠为 - 1. (默认值) , 即等同千src1.depth() 。


下面的数学公式表示 : 用 addWeighted 函数计算 以 下 两个数组 ( src1 和 src2 )

dst = srcl[I] * alpha + src2[I] * beta + gamma;

的加权和 , 得到结果输出给第四个参数 ,也就是 addWeighted 函数的作用 的矩阵表达式。

其中 l 是多维数组元素的索引值 。 而且 , 在遇到多通道数组的时候 , 每个通道都需要独立地进行处理。另外需要注意的是 , 当输出数组的深度为 CY_32S 时 ,这个函数就不适用了 , 这时候就会内存溢出或者算出的结果压根不对。理论和函数的讲解就是上面这些 , 接着我们来看代码实例 , 以融会贯通 。

//描述:利用cv::addWeighted()函数实现图像线性混合
bool LinearBlending()
{
//【0】定义一些局部变量
double alphaValue = 0.5;
double betaValue;
Mat srcImage2, srcImage3, dstImage;

// 【1】读取图像 ( 两幅图片需为同样的类型和尺寸 )
srcImage2 = imread("D:\\QT\\project\\opencv_qtcreaor\\image\\mogu.jpg");
srcImage3 = imread("D:\\QT\\project\\opencv_qtcreaor\\image\\rain.jpg");

if( !srcImage2.data ) { qDebug()<<"读取srcImage2错误! \n"<<endl; return false; }
if( !srcImage3.data ) { qDebug()<<"读取srcImage3错误! \n"<<endl; return false; }

// 【2】进行图像混合加权操作
betaValue = ( 1.0 - alphaValue );
addWeighted( srcImage2, alphaValue, srcImage3, betaValue, 0.0, dstImage);

// 【3】显示原图窗口
namedWindow("<2>线性混合示例窗口【原图】");
namedWindow("<3>线性混合示例窗口【效果图】");
imshow( "<2>线性混合示例窗口【原图】", srcImage2 );
imshow( "<3>线性混合示例窗口【效果图】", dstImage );

return true;
}

下面对以上代码进行解析。
( 0 ) 首先当然是定义一 些局部变量、 alpha 值、 beta 值 , 以及三个 Mat 类型 的变量,在这里我们设置 alpha 值为 0.5 。

//【0】定义一些局部变量
double alphaValue = 0.5;
double betaValue;
Mat srcImage2, srcImage3, dstImage;

( 1 ) 读取两幅图像并作错误处理这步很简单,直接看代码 。

// 【1】读取图像 ( 两幅图片需为同样的类型和尺寸 )
srcImage2 = imread("mogu.jpg");
srcImage3 = imread("rain.jpg");

在这里需要注意的是 , 因为我们是对 srclmage1和 srclmage2 求和,所以它们必须要有相同的尺寸(宽度和高度)和类型,不然多余的部分没有对应的"伴",肯定会出问题。

( 2 ) 进行图像混合加权操作
载入图像后,我们就可以来生成混合图像,也就是之前公式中的 g(x) 。 为此目的,使用函数 addWeighted 可以很方便地实现。代码其实很简单 , 就是这样 :

// 【2】进行图像混合加权操作
betaValue = ( 1.0 - alphaValue );
addWeighted( srcImage2, alphaValue, srcImage3, betaValue, 0.0, dstImage);
//其中对应 于 addWeighted 的参数中的 beta 值为 1 -alpha, gamma 值为 0

运行结果:

原图:

(OpenCV — 7)ROI 区域图像叠加&图像混合_权重_03

(OpenCV — 7)ROI 区域图像叠加&图像混合_局部变量_04

效果图:

(OpenCV — 7)ROI 区域图像叠加&图像混合_权重_05

ROI区域和线性混合

//描述:线性混合实现函数,指定区域线性图像混合.利用cv::addWeighted()函数结合定义
//感兴趣区域ROI,实现自定义区域的线性混合
bool ROI_LinearBlending()
{

//【1】读取图像
Mat srcImage4= imread("D:\\QT\\project\\opencv_qtcreaor\\image\\dota_pa.jpg",1);
Mat logoImage= imread("D:\\QT\\project\\opencv_qtcreaor\\image\\image1.jpg");

if( !srcImage4.data ) { printf("读取srcImage4错误~! \n"); return false; }
if( !logoImage.data ) { printf("读取logoImage错误~! \n"); return false; }

//【2】定义一个Mat类型并给其设定ROI区域
Mat imageROI;
//方法一
imageROI= srcImage4(Rect(200,250,logoImage.cols,logoImage.rows));
//方法二
//imageROI= srcImage4(Range(250,250+logoImage.rows),Range(200,200+logoImage.cols));

//【3】将logo加到原图上
addWeighted(imageROI,0.5,logoImage,0.3,0.,imageROI);

//【4】显示结果
namedWindow("<4>区域线性图像混合示例窗口");
imshow("<4>区域线性图像混合示例窗口",srcImage4);

return true;
}

运行结果:

原图:

(OpenCV — 7)ROI 区域图像叠加&图像混合_数组_06

(OpenCV — 7)ROI 区域图像叠加&图像混合_数组_07

效果图:

(OpenCV — 7)ROI 区域图像叠加&图像混合_权重_08