音频关键点提取 rnn 提取音频中的某些声音

转载

mob64ca1409970a 2024-06-23 13:14:24

文章标签 音频关键点提取 rnn 如何提取左声道音频采样率 Adobe 进度条 文章分类 机器学习人工智能

1. 问题 问：对于一首歌，怎么提取其中的人声或者伴奏？答：看下边写的，文末还有音频效果演示。

2. 思路 对于大多拿到手里的歌曲文件，经混音制作后，左右声道的人声是一样的，而伴奏则在两声道不同，因此利用“Adobe Audition”的中置声道提取，提取左右两声道中相同的声音，就做到了人声提取，反之可以得到伴奏声音。 缺点： (1) 如果待处理的文件，左右声道没有上述性质，就另想它法吧。 (2)不管哪个声道，人声和伴奏都是混合的，不可避免地，在某些频率上，重叠部分会比较多，而重叠程度越严重，分离效果就越糟糕。因此，直接做中置提取，粗略听上去是没有问题的，但是稍微认真一些，会发现所提取的人声还带有一些伴奏的杂音，而且通常中置提取后，音质会变得下降(非采样率)，比如高频太闷，低频嗡嗡，人声变得缺失细节。当然这些音质问题，一定程度上，可以通过AU加一些效果器，滤波器拉一拉，但是很难达到最初录制的声轨效果。如果只是分离着玩，那就没什么问题，如果要求比较高或者是商用，还是直接买去吧。

3. 实现 为了验证中置声道提取的效果，首先拿着“鸡叫”、“狗叫”、“马叫”的音频素材，剪了一段立体声样品，左声道是“鸡叫+狗叫”，右声道是“马叫+狗叫”。将这段样品，通过“AU-效果-立体声声像-中置声道提取器”进行设置。如果提取人声，就选择默认预设，如果提取伴奏，就选择“移除人声”预设。通过设置中心电平和侧边电平，可以实现微调人声和伴奏的范围，但效果也比较凑合，毕竟只是调整电平，灵活度一般。

音频关键点提取 rnn 提取音频中的某些声音_进度条