1. 问题 问:对于一首歌,怎么提取其中的人声或者伴奏? 答:看下边写的,文末还有音频效果演示。 

2. 思路 对于大多拿到手里的歌曲文件,经混音制作后,左右声道的人声是一样的,而伴奏则在两声道不同,因此利用“Adobe Audition”的中置声道提取,提取左右两声道中相同的声音,就做到了人声提取,反之可以得到伴奏声音。 缺点: (1) 如果待处理的文件,左右声道没有上述性质,就另想它法吧。 (2)不管哪个声道,人声和伴奏都是混合的,不可避免地,在某些频率上,重叠部分会比较多,而重叠程度越严重,分离效果就越糟糕。 因此,直接做中置提取,粗略听上去是没有问题的,但是稍微认真一些,会发现所提取的人声还带有一些伴奏的杂音,而且通常中置提取后,音质会变得下降(非采样率),比如高频太闷,低频嗡嗡,人声变得缺失细节。 当然这些音质问题,一定程度上,可以通过AU加一些效果器,滤波器拉一拉,但是很难达到最初录制的声轨效果。 如果只是分离着玩,那就没什么问题,如果要求比较高或者是商用,还是直接买去吧。

3. 实现 为了验证中置声道提取的效果,首先拿着“鸡叫”、“狗叫”、“马叫”的音频素材,剪了一段立体声样品,左声道是“鸡叫+狗叫”,右声道是“马叫+狗叫”。 将这段样品,通过“AU-效果-立体声声像-中置声道提取器”进行设置。 如果提取人声,就选择默认预设,如果提取伴奏,就选择“移除人声”预设。通过设置中心电平和侧边电平,可以实现微调人声和伴奏的范围,但效果也比较凑合,毕竟只是调整电平,灵活度一般。

音频关键点提取 rnn 提取音频中的某些声音_进度条


4. 效果

这里可以听到原版的鸡+狗+马叫,通过中置提取,可以把狗声提取出来。