今天的主要任务应该准备毕设的答辩&&下阶段学习任务确定&&日常学习

------0453可以开始该ppt啦~~

《人类语言处理》03

1、不同token

phoneme(音标)【使用第二多】语音和文字关系明确,不过需要构建Lexicon(将语音对应的没有含义的音标和能够被人理解的字母转化)

nlp自然语言处理 槽位是什么 nlp自然语言处理毕设_语音识别

grapheme(char)【使用最多】方便收集

word【使用最少】容易V过大,甚至无穷

morpheme(词根)需要语言学家或者统计来找

nlp自然语言处理 槽位是什么 nlp自然语言处理毕设_人工智能_02


2、Acoustic feature

25ms提取一个frame,窗口移动为10Min---->1s取100个frames

nlp自然语言处理 槽位是什么 nlp自然语言处理毕设_nlp自然语言处理 槽位是什么_03


处理方式有spectrogram->filter-bank(目前使用最多-75%)->wave-form->MFCC(使用次多-18%)

nlp自然语言处理 槽位是什么 nlp自然语言处理毕设_语音识别_04


nlp自然语言处理 槽位是什么 nlp自然语言处理毕设_语音识别_05

3、两种做语音辨识的角度

nlp自然语言处理 槽位是什么 nlp自然语言处理毕设_nlp自然语言处理 槽位是什么_06

-----0602干个早饭,看完了03hhhh,我觉得李宏毅老师一定是个很会‘讲故事’的人!!!不知道为啥,好想刷算法题啊!先去整理毕设答辩了!!!

—0721把时间分配了一下,并写了对应的讲稿。先去收下宿舍,一会回来通读一下。看看时间控制情况。

–0815开始看《人类语言》04了,这里主要将那些s2s Model。刚刚看的就是比较普通的seq2seq叫,LAS,老师又介绍了一些可以做encoder中间层的model,包括cnn、rnn、attention

—0927大概联系了6、7遍,控制在4分40秒左右。去剪一下视频

----1050视频剪的很细,不仅注意了时间,还加了Attention额鹅鹅鹅,感觉自己太卷了。

----1417继续练习啦!!!要收看手机了!!手机都感觉油油的了

----2210下午写答辩申请书,然后去开会,去做核酸,去吃饭。
后来给naiji师兄报告了一遍,讨论了一下会问到的问题,还是蛮开心的hhhh。
真的感受到了自己的进步,看东西会先去看公式了!!!
后来去彩排拍照,去跑了个5km,岔气了,去洗澡,回来和父母视频。