nlp下游任务是什么 nlp hmm

转载

mob6454cc66e0d5 2023-10-15 09:31:53

自然语言处理笔记总目录

一般以文本序列数据为输入, 以该序列对应的隐含序列为输出

什么是隐含序列？

例如：

给定一段文本: "人生该如何起头"
 
我们看到的这句话可以叫做: 观测序列
 
我们可以将这句话以词为单位进行划分得到:
 
["人生", "该", "如何", "起头"]
 
那么每个词对应的词性就是它的隐含序列, 如:
 
["n", "r", "r", "v"]

HMM的作用：

HMM过程简述：

首先, HMM模型表示为： $nlp下游任务是什么 nlp hmm_HMM$ ，其中 $nlp下游任务是什么 nlp hmm_人工智能_02$
接着，我们开始训练HMM模型，语料就是事先准备好的一定数量的观测序列及其对应的隐含序列，通过极大似然估计求得一组参数，使由观测序列到对应隐含序列的概率最大
在训练过程中，为了简化计算，马尔可夫提出一种假设：隐含序列中每个单元的可能性只与上一个单元有关。这个假设就是著名的隐含假设
训练后，我们就得到了具备预测能力的新模型： $nlp下游任务是什么 nlp hmm_HMM$ ，其中的模型参数已经改变
之后给定输入序列 $nlp下游任务是什么 nlp hmm_自然语言处理_04$ ，经过模型计算 $nlp下游任务是什么 nlp hmm_人工智能_05$ 得到对应隐含序列的条件概率分布
最后，使用维特比算法从隐含序列的条件概率分布中找出概率最大的一条序列路径就是我们需要的隐含序列： $nlp下游任务是什么 nlp hmm_nlp下游任务是什么_06$

CRF模型的作用：

CRF过程简述：

首先，CRF模型表示为： $nlp下游任务是什么 nlp hmm_人工智能_07$ ，其中 $nlp下游任务是什么 nlp hmm_HMM_08$ 到 $nlp下游任务是什么 nlp hmm_自然语言处理_09$ 是模型参数.
接着，我们开始训练CRF模型，语料同样是事先准备好的一定数量的观测序列及其对应的隐含序列
与此同时我们还需要做人工特征工程，然后通过不断训练求得一组参数，使由观测序列到对应隐含序列的概率最大
训练后，我们就得到了具备预测能力的新模型： $nlp下游任务是什么 nlp hmm_人工智能_07$ ，其中的模型参数已经改变
之后给定输入序列 $nlp下游任务是什么 nlp hmm_nlp_11$ ，经过模型计算 $nlp下游任务是什么 nlp hmm_人工智能_12$ 得到对应隐含序列的条件概率分布
最后，还是使用维特比算法从隐含序列的条件概率分布中找出概率最大的一条序列路径就是我们需要的隐含序列： $nlp下游任务是什么 nlp hmm_HMM_13$