二值图像和label图像是图像分割中经常用到的两种图像。


二值图像的每个像素只有两种可能的取值,例如0或者255。通常0代表图像的背景,而255代码图像前景。图像二值化是最简单的图像分割模型。设置一个灰度阈值,将图像中阈值以下的像素值设置为背景,阈值以上的像素值设置为前景,即可得当一副二值图像。 在VTK中可以通过vtkImageThreshold类实现图像二值化。


#include <vtkSmartPointer.h>
#include <vtkJPEGReader.h>
#include <vtkImageThreshold.h>//阈值化处理
#include <vtkImageActor.h>
#include <vtkRenderer.h>
#include <vtkRenderWindow.h>
#include <vtkRenderWindowInteractor.h>
#include <vtkInteractorStyleImage.h>

int main()
{
	vtkSmartPointer<vtkJPEGReader> reader =	vtkSmartPointer<vtkJPEGReader>::New();
	reader->SetFileName("Data\\lena-gray.jpg");
	reader->Update();

	vtkSmartPointer<vtkImageThreshold> threshould =	vtkSmartPointer<vtkImageThreshold>::New();
	threshould->SetInputConnection(reader->GetOutputPort());
	threshould->ThresholdByUpper(90); //取大于90为有效范围
	threshould->SetInValue(255);
	threshould->SetOutValue(0);
	threshould->Update(); //算法执行后必须添加更新消息!!!

	vtkSmartPointer<vtkImageActor> origActor =	vtkSmartPointer<vtkImageActor>::New();
	origActor->SetInputData(reader->GetOutput());
	vtkSmartPointer<vtkImageActor> binaryActor = vtkSmartPointer<vtkImageActor>::New();
	binaryActor->SetInputData(threshould->GetOutput());
	
	double origView[4] = { 0, 0, 0.5, 1 };
	double binaryView[4] = { 0.5, 0, 1, 1 };
	vtkSmartPointer<vtkRenderer> origRender = vtkSmartPointer<vtkRenderer>::New();
	origRender->SetViewport(origView);
	origRender->AddActor(origActor);
	origRender->ResetCamera();
	origRender->SetBackground(1, 1, 1);

	vtkSmartPointer<vtkRenderer> binaryRender = vtkSmartPointer<vtkRenderer>::New();
	binaryRender->SetViewport(binaryView);
	binaryRender->AddActor(binaryActor);
	binaryRender->ResetCamera();
	binaryRender->SetBackground(1, 1, 1);

	/
	vtkSmartPointer<vtkRenderWindow> rw = vtkSmartPointer<vtkRenderWindow>::New();
	rw->AddRenderer(origRender);
	rw->AddRenderer(binaryRender);
	rw->SetSize(640, 240);
	rw->SetWindowName("Binary Image");

	vtkSmartPointer<vtkRenderWindowInteractor> rwi = vtkSmartPointer<vtkRenderWindowInteractor>::New();
	vtkSmartPointer<vtkInteractorStyleImage> style = vtkSmartPointer<vtkInteractorStyleImage>::New();
	rwi->SetInteractorStyle(style);
	rwi->SetRenderWindow(rw);
	rwi->Initialize();
	rwi->Start();
	return 0;
}

运行结果:


二值化图片 Python 二值化图片 picture_连通分量

vtkImageThreshold类中定义了两个阈值,UpperThreshold和LowerThreshold,这两个值将图像的值域划分为三部分:大于UpperThreshold,小于LowerThreshold,以及位于LowerThreshold和UpperThreshold之间的三段。函数ThresholdByUpper()设置为取大于UpperThreshold的灰度范围为有效范围,并通过函数SetInValue()来设置该范围内的输出值,SetOutValue()设置范围外的输出值,本例中取大于100所有像素输出值为255,而小于100的像素值为0。

另外还有其他两种方式,ThresholdByLower()取小于LowerThreshold的范围为有效范围;ThresholdBetween()取LowerThreshold和UpperThreshold之间的部分为有效范围。另外SetInValue()和SetOutValue()如果不设置的话,图像会按原图输出。可以通过该类来实现图像数据范围的截断操作。

对于二值图像前景由多个对象组成,而每个对象是一个连通分量,对象之间不存在连通关系。在处理图像时,需要将不同的对象分别提取出来或将不同对象赋一个label值,这样得到的图像成为label图像。目前VTK中没有提取二值图像连通分量的filter及相应的对二值图像label化的filter。如果要实现该功能,可以考虑与ITK相结合。


参考资料:

1.《The Visualization Toolkit – AnObject-Oriented Approach To 3D Graphics (4th Edition)》
2. 张晓东, 罗火灵. VTK图形图像开发进阶[M]. 机械工业出版社, 2015.

所用软件:vtk7.0+visual studio 2013