概述

SDB(Superdirective Beamformer,超指向波束)是麦克风阵列处理中实现语音增强的一种方法。SDB使用MVDR(Minimum Variance Distortionless Response)准则,且采用理论推导的噪声场,如散射噪声场。超指向的“超(Super)”指的是SDB相对于传统DSB(Delay-Sum Beamformer)能实现更好的指向性。本文介绍频域SDB原理,包括MVDR准则、所用噪声场并画出波束图(Beam Pattern)。
  符号表示:对语音信号做短时傅里叶变换,用swift 麦克风音量图 麦克风pattern_swift 麦克风音量图 表示各频点,swift 麦克风音量图 麦克风pattern_语音降噪_02 表示帧编号,swift 麦克风音量图 麦克风pattern_超指向波束_03表示麦克风个数,swift 麦克风音量图 麦克风pattern_swift 麦克风音量图_04表示声速,swift 麦克风音量图 麦克风pattern_swift 麦克风音量图_05为目标声源的角度,swift 麦克风音量图 麦克风pattern_超指向波束_06表示第swift 麦克风音量图 麦克风pattern_语音降噪_07个麦克风与第swift 麦克风音量图 麦克风pattern_语音降噪_08个麦克风的时延差,swift 麦克风音量图 麦克风pattern_麦克风阵列_09表示第swift 麦克风音量图 麦克风pattern_语音降噪_07个麦克风与第swift 麦克风音量图 麦克风pattern_语音降噪_08个麦克风的距离。swift 麦克风音量图 麦克风pattern_swift 麦克风音量图_12表示波束的系数,swift 麦克风音量图 麦克风pattern_麦克风阵列_13表示来自角度swift 麦克风音量图 麦克风pattern_swift 麦克风音量图_05方向的方向向量,swift 麦克风音量图 麦克风pattern_语音降噪_15表示噪声互相关矩阵。下文为简洁起见省略括号,分别用swift 麦克风音量图 麦克风pattern_语音降噪_16swift 麦克风音量图 麦克风pattern_swift 麦克风音量图_17swift 麦克风音量图 麦克风pattern_语音增强_18表示对应项。

原理

MVDR

MVDR的目标是求解如下优化问题:
 



  

swift 麦克风音量图 麦克风pattern_语音增强_19


  

swift 麦克风音量图 麦克风pattern_语音降噪_20


 



采用拉格朗日乘子法可解得




swift 麦克风音量图 麦克风pattern_语音增强_21




可见,如果已知目标声源方向,已知噪声互相关矩阵

swift 麦克风音量图 麦克风pattern_语音降噪_22,就可使用上式求得

swift 麦克风音量图 麦克风pattern_麦克风阵列_23。其中目标声源方向可使用DOA估计算法求得,而标准的超指向波束使用的噪声互相关矩阵为散射(Diffused)噪声场的互相关矩阵,后文将介绍。


  拉格朗日乘子法推导

swift 麦克风音量图 麦克风pattern_语音降噪_24的具体过程如下:


拉格朗日函数为




swift 麦克风音量图 麦克风pattern_超指向波束_25


 



对其求导且置零




swift 麦克风音量图 麦克风pattern_语音降噪_26


 







swift 麦克风音量图 麦克风pattern_swift 麦克风音量图_27


 



将上式代入MVDR的约束条件

swift 麦克风音量图 麦克风pattern_语音降噪_28中,可解得

swift 麦克风音量图 麦克风pattern_超指向波束_29,再将

swift 麦克风音量图 麦克风pattern_swift 麦克风音量图_30代入上式,即可得上文所示

swift 麦克风音量图 麦克风pattern_语音降噪_24的解析式。

散射噪声场

散射噪声场描述处于强反射封闭空间中的噪声场,即麦克风接收到的噪声来自于四面八方的反射噪声。3D空间的散射噪声场,也称为spherical isotropic noise field,其互相关矩阵为



swift 麦克风音量图 麦克风pattern_swift 麦克风音量图_32


 



其中




swift 麦克风音量图 麦克风pattern_麦克风阵列_33


 



2D空间的散射噪声场,也称为cylindrical isotropic noise field,模拟比如天花板和地板弱反射而四周强反射的房间内的噪声场。其互相关矩阵中的元素为




swift 麦克风音量图 麦克风pattern_语音降噪_34


 



其中

swift 麦克风音量图 麦克风pattern_swift 麦克风音量图_35为第一类零阶Bessel函数。


  由于散射噪声场的互相关矩阵只与麦克风阵列结构有关,而与信号无关,因此计算所得的波束系数

swift 麦克风音量图 麦克风pattern_语音降噪_24也与数据无关。只有当目标方向改变时,才需重新计算

swift 麦克风音量图 麦克风pattern_语音降噪_24


  以两麦为例,互相关矩阵的推导如下:


对spherical isotropic噪声场,考虑下图所示的球体,假设球半径

swift 麦克风音量图 麦克风pattern_语音降噪_38远大于麦克风间距

swift 麦克风音量图 麦克风pattern_麦克风阵列_39




swift 麦克风音量图 麦克风pattern_麦克风阵列_40


图1 spherical isotropic 噪声场示意图


 



先考虑只有两个噪声源,分别来自不同的方向

swift 麦克风音量图 麦克风pattern_语音降噪_41

swift 麦克风音量图 麦克风pattern_语音降噪_42,两个麦克风分别用下标A和B表示,则麦克风接收信号为




swift 麦克风音量图 麦克风pattern_麦克风阵列_43


swift 麦克风音量图 麦克风pattern_麦克风阵列_44


 



自相关功率谱和互相关功率谱分别为




swift 麦克风音量图 麦克风pattern_超指向波束_45


swift 麦克风音量图 麦克风pattern_语音降噪_46


swift 麦克风音量图 麦克风pattern_swift 麦克风音量图_47


 


由互相关函数的定义



swift 麦克风音量图 麦克风pattern_语音降噪_48


 



可知




swift 麦克风音量图 麦克风pattern_麦克风阵列_49


 



如果存在N个不相关的噪声源,互相关函数为




swift 麦克风音量图 麦克风pattern_语音降噪_50


 



考虑图1所示球面上所有点都是噪声源,红线所示的圆环都对应同一个角度

swift 麦克风音量图 麦克风pattern_语音降噪_51,圆环的面积是

swift 麦克风音量图 麦克风pattern_语音增强_52,球表面积为

swift 麦克风音量图 麦克风pattern_语音降噪_53,则有




swift 麦克风音量图 麦克风pattern_麦克风阵列_54


 



 同理,对cylindrical isotropic噪声场,在平面圆上求解,有




swift 麦克风音量图 麦克风pattern_超指向波束_55


 

 


 以上。

波束图

Beam pattern的定义为swift 麦克风音量图 麦克风pattern_超指向波束_56,即给定那个某swift 麦克风音量图 麦克风pattern_语音降噪_16,它反映波束在不同频点swift 麦克风音量图 麦克风pattern_语音降噪_58上对不同来声方向swift 麦克风音量图 麦克风pattern_语音增强_59的信号给予多大增益。从波束图上能清晰看出波束的指向性、不同频点的主瓣宽度、混叠频率等信息。
  这里设麦克风阵列为彼此间距6cm的四麦克风圆阵(分别分布在0°、90°、180°和270°方向),目标方向为135°,采样率为16kHz,使用超指向波束计算swift 麦克风音量图 麦克风pattern_语音降噪_16,噪声场采用spherical isotropic噪声场,根据定义画出Beam pattern如图2所示。



swift 麦克风音量图 麦克风pattern_麦克风阵列_61


图2 超指向波束的波束图示意


 



 以上。

Reference

本文主要参照书[1]的第2章,关于散射噪声场的推导参照Gannot博士论文[2]的附录A。图1来自[2]。
[1] M. Brandstein, D. Ward, Microphone Arrays: Signal Processing Techniques and Applications, Germany, Berlin:Springer, 2001.
[2] http://www.eng.biu.ac.il/~gannot/articles/phd_pdf.pdf