论文 SPECAUGMENT ON LARGE SCALE DATASETS摘要语音增强是一种直接作用在输入话语声谱图上的自动语音增强方法,实践证明在端到端网络上非常有效,训练声学模型使用语音增强的数据和噪音扰动的训练数据,介绍了SpecAugment的一种修改,根据发音的长度调整了时间掩码的大小和多重性,通过自适应掩盖可
转载
2024-01-04 07:36:51
53阅读
ECAPA_TDNN代码和论文细节分析一、数据部分(dataloader.py)二、网络结构(model.py)2.1 整体网络结构2.2 SpecAugment算法2.3 注意力统计池化2.4 SE Res2Blocks2.4.1 SE block2.4.2 res2net2.5 MFA多层特征聚合三、损失函数AAMsoftmax(loss.py)一、数据部分(dataloader.py)数据集