core模块下面的矩阵掩码操作:
矩阵的掩码操作很简单。其思想是:根据掩码矩阵(也称作核)重新计算图像中每个像素的值。掩码矩阵中的值表示近邻像素值(包括该像素自身的值)对新像素值有多大影响。从数学观点看,我们用自己设置的权值,对像素邻域内的值做了个加权平均。如果熟悉神经网络的话,说白了就是一个滤波器,所以官网给出的第二个方法就是滤波器访问。
思考一下图像对比度增强的问题。我们可以对图像的每个像素应用下面的公式:
上面那种表达法是公式的形式,而下面那种是以掩码矩阵表示的紧凑形式。使用掩码矩阵的时候,我们先把矩阵中心的元素(上面的例子中是(0,0)位置的元素,也就是5)对齐到要计算的目标像素上,再把邻域像素值和相应的矩阵元素值的乘积加起来。虽然这两种形式是完全等价的,但在大矩阵情况下,下面的形式看起来会清楚得多。
现在,我们来看看实现掩码操作的两种方法。一种方法是用基本的像素访问方法,另一种方法是用 filter2D 函数。
看下window下vs2013的实现部分:
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include <iostream>
using namespace std;
using namespace cv;
static void help()
{
cout << endl
<< "This program shows how to filter images with mask: the write it yourself and the"
<< "filter2d way. " << endl
<< "Usage:" << endl
<< " [image_name -- default lena.jpg] [G -- grayscale] " << endl << endl;
}
void Sharpen(const Mat& myImage, Mat& Result);
int main(int argc, char* argv[])
{
help();
const char* filename = "C:\\Users\\Administrator\\Desktop\\Lena.jpg";
Mat I, J, K;
printf("GRAUSCAL OR COLOR? please enter G/C");
char ch = getchar();
if (ch == 'G')
I = imread(filename, CV_LOAD_IMAGE_GRAYSCALE);
else
I = imread(filename, CV_LOAD_IMAGE_COLOR);
printf("%s\n", filename);
namedWindow("Input", WINDOW_AUTOSIZE);
namedWindow("Output", WINDOW_AUTOSIZE);
imshow("Input", I);
double t = (double)getTickCount();
Sharpen(I, J);//实现掩码操作
t = ((double)getTickCount() - t) / getTickFrequency();
cout << "Hand written function times passed in seconds: " << t << endl;
imshow("Output", J);
waitKey(0);
//滤波器在图像处理中的应用太广泛了,因此OpenCV也有个用到了滤波器
//掩码(某些场合也称作核)的函数。不过想使用这个函数,你必须先定义一个表示掩码的 Mat 对象:
Mat kern = (Mat_<char>(3, 3) << 0, -1, 0,
-1, 5, -1,
0, -1, 0);
t = (double)getTickCount();
//filter2D还带有第五个可选参数——指定核的中心,和第六个可选参数——指定函数在未定义区域(边界)
//的行为。使用该函数有一些优点,如代码更加清晰简洁、通常比 自己实现的方法 速度更
//快(因为有一些专门针对它实现的优化技术)等等。例如,我测试的滤波器方法仅花了13毫秒,
//而前面那样自己实现迭代方法花了约31毫秒,二者有着不小差距。
filter2D(I, K, I.depth(), kern);//使用滤波器掩码函数
t = ((double)getTickCount() - t) / getTickFrequency();
cout << "Built-in filter2D time passed in seconds: " << t << endl;
imshow("Output", K);
waitKey(0);
return 0;
}
void Sharpen(const Mat& myImage, Mat& Result)
{
CV_Assert(myImage.depth() == CV_8U); // 只接受unchar类型图片
//根据图像的通道数,我们有一个或多个子列。我们用指针在每一个通道上迭代,因此通道数就决定了需计算的元素总数。
const int nChannels = myImage.channels();
Result.create(myImage.size(), myImage.type());//创建了一个与输入有着相同大小和类型的输出图像。
//利用C语言的[]操作符,我们能简单明了地访问像素。因为要同时访问多行像素,
//所以我们获取了其中每一行像素的指针(分别是前一行、当前行和下一行)。
//此外,我们还需要一个指向计算结果存储位置的指针。有了这些指针后,我们使用[]操作符,
//就能轻松访问到目标元素。为了让输出指针向前移动,我们在每一次操作之后对输出指针进行了递增(移动一个字节):
for (int j = 1; j < myImage.rows - 1; ++j)
{
const uchar* previous = myImage.ptr<uchar>(j - 1);//获取前一行的指针
const uchar* current = myImage.ptr<uchar>(j);//获取当前行的指针
const uchar* next = myImage.ptr<uchar>(j + 1);//获取下一行的指针
uchar* output = Result.ptr<uchar>(j);//输出为当前行的指针
//对对应的通道数进行掩码操作
for (int i = nChannels; i < nChannels*(myImage.cols - 1); ++i)
{
*output++ = saturate_cast<uchar>(5 * current[i]
- current[i - nChannels] - current[i + nChannels] - previous[i] - next[i]);
}
}
//在图像的边界上,上面给出的公式会访问不存在的像素位置(比如(0,-1))。
//因此我们的公式对边界点来说是未定义的。一种简单的解决方法,
//是不对这些边界点使用掩码,而直接把它们设为0:
Result.row(0).setTo(Scalar(0));
Result.row(Result.rows - 1).setTo(Scalar(0));
Result.col(0).setTo(Scalar(0));
Result.col(Result.cols - 1).setTo(Scalar(0));
}