如何用信息熵计算图片的复杂度python

转载

AI独步天下 2024-10-31 06:45:00

文章标签 最大熵设计思想灰度 文章分类 Python 后端开发

文章目录

前言
一、熵是什么？

1.信息量如何计算？
2.熵如何计算？

二、最大熵方法

1.设计思想
2.算法步骤
3.C++代码
4.实验结果

参考资料

前言

在图像分析中，通常需要将所关心的目标从图像中提取出来，这种从图像中某个特定区域与其他部分进行分离并提取出来的处理，就是图像分割。所以图像分割处理实际上就是区分图像中的“前景目标”和“背景”，所以通常又称之为图像的二值处理。之前我们已经介绍过基于图像灰度分布的阈值方法和大津二值化算法。今天我们再介绍一种二值化算法：最大熵方法。

一、熵是什么？

熵是信息论中对不确定性的度量，是对数据中所包含信息量大小的度量。熵取最大值时，就表明获得的信息量最大。
信息量：信息量有大有小。比如太阳从东边升起，这是一个确定的事件，没有一点信息量；比如说某人买了一张彩票，有99%的概率会中奖，那这个事情信息量就很大，因为本来概率很小很小的事情变得很确定了。

1.信息量如何计算？

一个事件的信息量就是这个事件发生的概率的负对数。
例如，符号 $如何用信息熵计算图片的复杂度python_最大熵$ 出现的概率为 $如何用信息熵计算图片的复杂度python_最大熵_02$ ，则符号 $如何用信息熵计算图片的复杂度python_最大熵$ 的自信息量 $如何用信息熵计算图片的复杂度python_最大熵_04$ 为 $如何用信息熵计算图片的复杂度python_灰度_05$

2.熵如何计算？

$如何用信息熵计算图片的复杂度python_最大熵_06$ 个符号，每个符号出现的概率为 $如何用信息熵计算图片的复杂度python_设计思想_07$ ，则符号集的信息熵为 $如何用信息熵计算图片的复杂度python_设计思想_08$
可以得到一个结论：当 $如何用信息熵计算图片的复杂度python_最大熵_09$ 时熵取最大值。

二、最大熵方法

1.设计思想

最大熵方法的设计思想是：选择适当的阈值将图像分为两类，两类的平均熵之和最大时，可以从图像中获得最大信息量，以此来确定最佳阈值。

2.算法步骤

求出图像中的所有像素的分布概率 $如何用信息熵计算图片的复杂度python_灰度_10$ （图像的灰度分布范围为[0,255]） $如何用信息熵计算图片的复杂度python_设计思想_11$ 其中， $如何用信息熵计算图片的复杂度python_灰度_12$ 为灰度值为 $如何用信息熵计算图片的复杂度python_最大熵_13$ 的像素个数； $如何用信息熵计算图片的复杂度python_灰度_14$ 为图像的总像素数；
给定一个初始阈值 $如何用信息熵计算图片的复杂度python_设计思想_15$ ， $如何用信息熵计算图片的复杂度python_灰度_16$ ；将图像分为 $如何用信息熵计算图片的复杂度python_灰度_17$ 和 $如何用信息熵计算图片的复杂度python_灰度_18$ 两类；
分别计算两个类的平均相对熵 $如何用信息熵计算图片的复杂度python_灰度_19$ $如何用信息熵计算图片的复杂度python_最大熵_20$ 其中 $如何用信息熵计算图片的复杂度python_灰度_21$ ；
当 $如何用信息熵计算图片的复杂度python_最大熵_22$ 之和为最大值时，此时的 $如何用信息熵计算图片的复杂度python_最大熵_23$ 为最佳阈值 $如何用信息熵计算图片的复杂度python_设计思想_24$ ，此时满足图像中的信息量最大。

3.C++代码

/* 最大熵算法 */
int main()
{
    cv::Mat image = cv::imread("Lena.bmp");
    cv::Mat gray_image = cv::Mat::zeros(image.size(), CV_8UC1);
    cv::cvtColor(image, gray_image, cv::COLOR_BGR2GRAY);

    int height = gray_image.rows;
    int width = gray_image.cols;

    // 计算像素分布概率
    float p[256] = { 0 };
    for (int row = 0; row < height; row++)
    {
        for (int col = 0; col < width; col++)
        {
            p[gray_image.at<uchar>(row, col)] = p[gray_image.at<uchar>(row, col)] + 1;
        }
    }
    for (int i = 0; i < 256; i++)
    {
        p[i] = p[i] / (height*width);
    }
    //保存E_1+E_2
    float E[256] = { 0.0 };

    //遍历所有的像素值
    int index = 0; //最大值的索引
    for (int th = 0; th < 256; th++)
    {
        // 计算p_Th
        float p_Th = 0.0;
        for (int i = 0; i < th+1; i++)
        {
            p_Th += p[i];
        }

        // 计算E_1
        float E_1 = 0.0, E_2 = 0.0;

        for (int i = 0; i < th + 1; i++)
        {
            if (fabs(p_Th) < 1e-6)
            {
                E_1 = 0;
            }
            else
            {
                E_1 += -(p[i] / p_Th) * log(p[i] / p_Th + 1e-6);
            }
            
        }
        for (int j = th + 1; j < 256; j++)
        {
            if (fabs(1 - p_Th) < 1e-6)
            {
                E_2 = 0;
            }
            else
            {
                E_2 += -(p[j] / (1 - p_Th))*log(p[j] / (1 - p_Th)+1e-6);
            }
        }
        if ((E_1 + E_2) > E[index])
        {
            index = th;
        }
        E[th] = E_1+E_2;
    }

    // 进行二值化
    cv::Mat output_image = cv::Mat::zeros(height, width, CV_8UC1);
    for (int row = 0; row < height; row++)
    {
        for (int col = 0; col < width; col++)
        {
            if (gray_image.at<uchar>(row, col) > index)
            {
                output_image.at<uchar>(row, col) = 255;
            }
            else
            {
                output_image.at<uchar>(row, col) = 0;
            }
        }
    }
    cv::imshow("input-image", gray_image);
    cv::imshow("output-image", output_image);
    cv::waitKey(0);
    return 0;
}

关于代码的几点说明：