今天的主要任务应该准备毕设的答辩&&下阶段学习任务确定&&日常学习
------0453可以开始该ppt啦~~
《人类语言处理》03
1、不同token
phoneme(音标)【使用第二多】语音和文字关系明确,不过需要构建Lexicon(将语音对应的没有含义的音标和能够被人理解的字母转化)
grapheme(char)【使用最多】方便收集
word【使用最少】容易V过大,甚至无穷
morpheme(词根)需要语言学家或者统计来找
2、Acoustic feature
25ms提取一个frame,窗口移动为10Min---->1s取100个frames
处理方式有spectrogram->filter-bank(目前使用最多-75%)->wave-form->MFCC(使用次多-18%)
3、两种做语音辨识的角度
-----0602干个早饭,看完了03hhhh,我觉得李宏毅老师一定是个很会‘讲故事’的人!!!不知道为啥,好想刷算法题啊!先去整理毕设答辩了!!!
—0721把时间分配了一下,并写了对应的讲稿。先去收下宿舍,一会回来通读一下。看看时间控制情况。
–0815开始看《人类语言》04了,这里主要将那些s2s Model。刚刚看的就是比较普通的seq2seq叫,LAS,老师又介绍了一些可以做encoder中间层的model,包括cnn、rnn、attention
—0927大概联系了6、7遍,控制在4分40秒左右。去剪一下视频
----1050视频剪的很细,不仅注意了时间,还加了Attention额鹅鹅鹅,感觉自己太卷了。
----1417继续练习啦!!!要收看手机了!!手机都感觉油油的了
----2210下午写答辩申请书,然后去开会,去做核酸,去吃饭。
后来给naiji师兄报告了一遍,讨论了一下会问到的问题,还是蛮开心的hhhh。
真的感受到了自己的进步,看东西会先去看公式了!!!
后来去彩排拍照,去跑了个5km,岔气了,去洗澡,回来和父母视频。