python神经网络音频降噪处理神经网络降噪工具

转载

mob64ca14150f43 2023-08-15 16:45:03

文章标签 python神经网络音频降噪处理去噪浮点神经网络 文章分类 Python 后端开发

Imagination 的神经网络加速器和 Visidon 的去噪算法被证明是完美的搭档

本文是总部位于芬兰的Visidon和总部位于英国的 Imagination合作的结果。Visidon 是公认的相机图像增强和分析算法专家，Imagination 拥有一系列世界一流的神经网络加速器(NNA)，每个内核的性能高达每秒 100 TOPS。

本文解决的问题是对来自传统彩色相机的图像进行去噪。解决方案分为两部分：

在不破坏图像细节的情况下去除噪声的算法。
一种高性能卷积引擎，能够运行经过训练的神经网络，该网络将彩色图像作为输入并输出去噪后的彩色图像。

Visidon 深度神经网络示例

图像去噪的过程有着悠久的历史。现代 CMOS 成像器的工作方式，可以被认为是一组光子计数器。光子以平均速率到达传感器：在波动相对较高的暗区较少，但在波动相对较低的较亮区域（即更好的信噪比）中更多。波动是由于光的物理学而产生的噪声（使用泊松统计），通常无法避免。但是，可以通过进一步处理去除噪声。关键是在不破坏图片内容的情况下做到这一点。

多年来，已经提出了许多解决方案。这些包括简单地稍微模糊图片、使用双边滤波器的复杂方法、基于流形理论的贝尔特拉米滤波器、尺度空间卡尔曼滤波器等。

关于去噪的有趣点首先是噪声在图像的平坦区域中最明显（对而言），而噪声在边缘附近不太明显（对而言）。然而，边缘最有可能被许多去噪算法以其他方式模糊或损坏。损坏的边缘在感知上与噪音一样糟糕！

Visidon 已经创建了一个卷积神经网络模型（相邻），完全实现了所需的目标——去除噪声并同时保留彩色图像中的边缘。

Imagination 的 Series4 多核 NNA 在执行 Visidon 的去噪网络时，提供高性能计算解决方案，同时在低功耗和小面积方面是同类产品中的佼佼者。

图 1 显示了一组示例结果。这项工作中使用的所有图像均为 4,096 x 3,072。这张图片在黑暗的夜间背景上有明亮的白色和蓝色灯光；原始图如图 1a 所示，每个像素 x100 的 RMS 误差如图 1b 所示。误差是在来自网络的浮点结果和通过将网络量化为 16 位，在 Imagination 的 NNA 上运行网络生成的结果之间得出的。

图 1（下图）显示了一个特别困难的图像——然而，任何 8 位颜色通道的最大差异是 +/-1。还展示了（图 1c）原始噪声图像的裁剪，d）来自浮点网络的输出，e）量化网络和 f）由 Visidon 的网络浮点实现提供的结果。无色彩失真，有效消除噪点，边缘完好无损。

python神经网络音频降噪处理神经网络降噪工具_神经网络

图 1.“困难”图像示例。在查看的十张示例图像中，所有结果都遵循相似的模式。在图 2 所示的日光场景中，每个颜色通道的每个像素没有超过 +/- 1 的错误发生。此图像中的噪点不太明显，但选择了裁剪图来证明降噪不会在任何颜色的边缘产生伪影。

python神经网络音频降噪处理神经网络降噪工具_浮点_02

图 2. 没有边缘或颜色失真的日光场景

在下一张图片（图 3）中，展示了一张明亮的测试图表。同样，没有大于 +/- 1 的错误，并且详细的裁剪显示缺少边缘伪影，这是 Visidon 算法的一个特征。

python神经网络音频降噪处理神经网络降噪工具_python神经网络音频降噪处理_03

图 3. Visidon 结果：明亮的测试图表。

最终的图像结果（图 4）显示了在低光下拍摄的测试图 - 另一个非常困难的图像。在这里，清楚地看到了噪声（泊松统计数据的信噪比随着平均水平的降低而变差）。在原始图像的细节中（图 6c），在较亮和较暗的区域，严重的颜色噪声都很明显。这是单独的红色、绿色和蓝色通道中不相关的波动产生随机颜色变化的结果（近似于三个维度的 Rician 统计）。

Visidon 的去噪算法消除了亮度（亮度）和色度（颜色）中的噪声，同时保留了边缘。值得注意的是，来自网络的浮点结果与来自网络的 16 位量化结果之间没有明显差异，而且这两个结果之间的最大差异在任何像素和任何颜色通道上都是 +/-1。

python神经网络音频降噪处理神经网络降噪工具_神经网络_04