操作指南:
文件夹分为数据库,函数库,和训练过程。
1、用matlab打开这个文件夹,添加进路径;
2、进入data文件夹,有两个m文件,打开recorddata,按照文件内的注释进行录音;
录音总共分为10遍,每组10个数字,前8遍用于训练,后两遍用于集中验证。
3、运行该文件中的dataprocess文件,会得到两个.mat文件,这就是训练集和验证集。
这两个文件,或在data文件夹内,或是在大文件夹内,这取决运行的时候点在了哪个路径,这不影响。如果它们在data文件夹内,那就将他们复制进大文件夹,总之最后大文件夹内应该是这样:
4、运行training文件,开始训练,总共用时不会超过1分钟。
训练完成后大文件夹内会多一个HMM.mat文件
5、运行validation文件进行验证,注释提示了可以更改的地方,两组验证都可以通过那就大功告成了。
我添加了置信度,其实这不是真实的置信度,但是这里我通过一些trick让这个数字客观上具有这样的效力。
如果出现这种情况,是因为没有收敛,一般重新训练一次就可以。模型训练的偶然性客观存在。
6、测试testing,录音测试
给出了复读和波形图,也可以去掉。
测试结果良好。
资源优势:
1、支持自己录制音频训练自己的模型,设计了方便快捷的方式,可以直接在matlab内部录制,而不用电脑录音机录MP4。(p.s.所有的类似模型都只能识别个人的语音,在小样本的情况下不存在性能优越的通用模型。)
2、额外设计了现场录测试集的方式来进行测试与展示,其他资源都只做到了验证,没有做测试。
3、所有需要使用到的函数都已经在func文件夹中另附,不需要通过matlab下载任何额外的toolbox。
4、文件名、函数名另做了精简,易于理解分析。每个需运行文件都注释丰富清晰。操作流程经过优化,十分简便。后附操作过程,有问题可以私信或评论。
5、博主用的是matlab2021a,不存在函数名过期变更等情况;
6、新版增加了加噪声对比。