python 音频相似性对比音频相似度

关注 mob6454cc636c54

python 音频相似性对比音频相似度

转载

mob6454cc636c54 2023-08-28 11:48:43

文章标签 python 音频相似性对比算法时间序列聚类 Dynamic 文章分类 Python 后端开发

语音相似度评价是用于测量语音之间的相似程度，常使用的算法是动态时间规整（Dynamic time warping，DTW），其原理是通过对齐时间序列来评估它们之间相似性。DTW是一种基于对齐的度量（alignment-based metric）与常见的欧式距离不同，DTW考虑到了时间维度上的信息，因此常用在信号处理领域，比如说话人识别，语音识别等。

python 音频相似性对比音频相似度_算法

下面举个例子解释为什么要用DTW而不是欧式距离，这里我们有一个时间序列的数据集，包含了一些不同的样式。如果我们要对其进行分类，简单的方法就是使用聚类算法，首先采用欧式距离作为度量，我们可以得到如下的结果：

python 音频相似性对比音频相似度_算法_02

容易发现在第二类中存在一些格格不入的样式；我们看下采用DTW聚类后的结果：

python 音频相似性对比音频相似度_算法_03

可以明显的发现，DTW聚类后的结果，每个类别的差别(类间聚类)比较小。

Dynamic Time Wrap

DTW是基于距离最近原则衡量两个长度不同的时间序列的相似度的方法，是一种非线性规整技术，需要满足以下几个条件：

单向对应，不能回头，从前往后对齐
两个序列首元素必须对应(但它不一定是唯一的匹配项)
序列中的元素一一对应，中间不能有空元素
对应之后，距离最近

DTW问题可以形式化的表示为

python 音频相似性对比音频相似度_算法_04

其中π表示对齐路径。如果我们直接使用穷举法，其时间复杂度是

python 音频相似性对比音频相似度_算法_05

为了减少计算量，我们采用动态规划的方式求解，其解法可以表示为：

python 音频相似性对比音频相似度_python 音频相似性对比_06

具体流程为：

python 音频相似性对比音频相似度_python 音频相似性对比_07

如果读者刷过Leetcode的话，应该会发现上面的描述有点像一道Hard的题目——最小编辑距离，这是比较经典的动态规划问题，因此这里就不再详细介绍了。

Experiment

下面我们做个简单的实验，首先我们有两个音频，如下所示

python 音频相似性对比音频相似度_算法_08

python 音频相似性对比音频相似度_算法_09

然后我们对第二个音频进行一些处理，首先利用超级变变变之变声器的原理对其进行慢放，然后加入一些白噪声，最后在开始增加一些延迟得到如下的音频。

python 音频相似性对比音频相似度_聚类_10

如果直接在时域进行计算那么计算量太大了，我们提取音频的128维的melspectrum进行简化计算。最后看下结果，dtw_hospital和dtw_number如下所示，可以看到，其最终的距离非常大，并且对其的结果和对角线相差较大。

python 音频相似性对比音频相似度_时间序列_11

我们再看看下dtw_number和dtw_number_noise规整后的结果，可以看到，对齐路径基本接近对角线且最终的距离比上面要小很多。

python 音频相似性对比音频相似度_算法_12

上面介绍了基本的DTW算法，除此之外还有一些改进算法，比如对规整路径进行一些限制或者增加权重等从而得到更优的结果，更详细的内容可以查阅参考文献[4]。

本文相关代码公众号语音算法组菜单栏点击Code获取

参考文献：

[1]. https://rtavenar.github.io/blog/dtw.html

[2]. https://www.kdnuggets.com/2022/05/dynamic-time-warping-algorithm-time-series-explained.html

[3].

[4]. Dynamic Time Warping Algorithm Review

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：python 生成器作用 python 生成器原理

下一篇：查看mysql 引擎 mysql 查询引擎

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册