概念

在计算机视觉领域,图像分割(Segmentation)指的是将数字图像细分为多个图像子区域(像素的集合)(也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。图像分割通常用于定位图像中的物体和边界(线,曲线等)。更精确的,图像分割是对图像中的每个像素加标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。图像分割的结果是图像上子区域的集合(这些子区域的全体覆盖了整个图像),或是从图像中提取的轮廓线的集合(例如边缘检测)。一个子区域中的每个像素在某种特性的度量下或是由计算得出的特性都是相似的,例如颜色、亮度、纹理。邻接区域在某种特性的度量下有很大的不同。更高语义的图像分割算法会将图像分割成前景背景,或者是找到具有特殊语义的分割线等。

输入:单幅图像。

输出:该图像具有不同含义的子区域会拥有不同的标记。


一般方法

1、聚类法(K-means等):选择聚类中心,将其余像素归类,对每一个聚类计算新的中心,如此往复。

2、直方图法:计算整幅图像的直方图,依据峰和谷来分类,例如以谷作为分界线。

3、边缘检测:边缘实际上是图像中不连续的部分,可以辅助聚类的进行,具体检测方法有梯度算子、拉普拉斯高斯算子、canny算子、sobel算子等。

4、区域生长:以某些个像素作为种子,将标记逐步扩散生长到相邻相似的像素上,新加入的像素也会作为种子继续进行扩散生长。

5、水平集方法:没有理解,有待进一步学习。