NLP中的句子级任务 nlp经典语句

转载

mob6454cc6658d1 2023-09-14 12:24:29

文章标签 NLP中的句子级任务自然语言处理人工智能 nlp 网络层 文章分类 NLP 人工智能

NLP经典论文：NNLM 笔记

论文
介绍

优点
缺点

模型结构

整体模型

输入
输出
整体流程

输入层

输入
输出

隐藏层

输入
输出

输出层

输入
输出
过程

softmax结构

优化目标

交叉熵cross entropy loss
NNLM模型的优化目标

示例

文章部分翻译

Abstract

相关的笔记
相关代码

pytorch
tensorflow

keras

pytorch API:

论文

介绍

2003/02发表的文章，提出了神经网路语言模型。该模型使用前 $NLP中的句子级任务 nlp经典语句_NLP中的句子级任务$ 个词来预测第 $NLP中的句子级任务 nlp经典语句_自然语言处理_02$ 个词，计算概率 $NLP中的句子级任务 nlp经典语句_自然语言处理_03$ 。首先将前 $NLP中的句子级任务 nlp经典语句_NLP中的句子级任务$ 个词用 one-hot 表示，然后使用投影矩阵降维，再将降维后的 $NLP中的句子级任务 nlp经典语句_NLP中的句子级任务$

优点

由于NNLM模型使用了低维紧凑的词向量对上文进行表示，这解决了词袋模型带来的数据稀疏、语义鸿沟等问题。

缺点

模型在神经网络层参数量巨大。

模型结构

NLP中的句子级任务 nlp经典语句_人工智能_06

整体模型

输入

$NLP中的句子级任务 nlp经典语句_网络层_07$ 为输入长度为n-1的一串文本，文本通过one-hot表示， $NLP中的句子级任务 nlp经典语句_自然语言处理_08$ ，V为字典大小，包含词的总数。

输出

$NLP中的句子级任务 nlp经典语句_NLP中的句子级任务_09$ ， $NLP中的句子级任务 nlp经典语句_nlp_10$ 为预测词，为 $NLP中的句子级任务 nlp经典语句_nlp_11$ 所对应的词，其中

$NLP中的句子级任务 nlp经典语句_自然语言处理_12$

意思就是给定n-1个输入词（ $NLP中的句子级任务 nlp经典语句_网络层_07$ ），预测第n个词 $NLP中的句子级任务 nlp经典语句_人工智能_14$ 时， $NLP中的句子级任务 nlp经典语句_人工智能_15$ 中概率最大的那个 $NLP中的句子级任务 nlp经典语句_自然语言处理_16$ 所对应的那个词 $NLP中的句子级任务 nlp经典语句_网络层_17$ ，就是预测输出的词。

整体流程

NLP中的句子级任务 nlp经典语句_NLP中的句子级任务_18

输入层

NLP中的句子级任务 nlp经典语句_nlp_19

输入

输出

$NLP中的句子级任务 nlp经典语句_nlp_22$

其中， $NLP中的句子级任务 nlp经典语句_自然语言处理_23$ 为拼接操作， $NLP中的句子级任务 nlp经典语句_nlp_24$ ， $NLP中的句子级任务 nlp经典语句_自然语言处理_25$ ， $NLP中的句子级任务 nlp经典语句_网络层_26$ 为变换矩阵，投影矩阵， $NLP中的句子级任务 nlp经典语句_nlp_27$ ，把one-hot表示的稀疏向量从稀疏的V维空间投影到稠密的m维空间。然后再将 $NLP中的句子级任务 nlp经典语句_人工智能_28$ 拼接起来，形成上下文信息，传递给下一层。

隐藏层

NLP中的句子级任务 nlp经典语句_人工智能_29

输入

$NLP中的句子级任务 nlp经典语句_nlp_22$

输出

$NLP中的句子级任务 nlp经典语句_nlp_31$ ，h为隐藏层神经元个数。

这层提取输入的特征，传给下一层。

输出层

NLP中的句子级任务 nlp经典语句_人工智能_32

输入

输入层与输出层连接时： $NLP中的句子级任务 nlp经典语句_nlp_33$ ， $NLP中的句子级任务 nlp经典语句_网络层_34$
输入层与输出层不连接时： $NLP中的句子级任务 nlp经典语句_网络层_35$

输出

$NLP中的句子级任务 nlp经典语句_NLP中的句子级任务_36$

过程

输入层与输出层连接时：
$NLP中的句子级任务 nlp经典语句_自然语言处理_37$
其中 $NLP中的句子级任务 nlp经典语句_nlp_38$ ，通常 $NLP中的句子级任务 nlp经典语句_NLP中的句子级任务_39$ 为 $NLP中的句子级任务 nlp经典语句_人工智能_40$
输入层与输出层不连接时：
$NLP中的句子级任务 nlp经典语句_网络层_41$

$NLP中的句子级任务 nlp经典语句_网络层_42$ 可以理解为融合特征之后，对每一个字典里面的词进行预测值打分，打分的值并不为概率， $NLP中的句子级任务 nlp经典语句_网络层_42$ 经过softmax，才是最后的预测概率 $NLP中的句子级任务 nlp经典语句_网络层_44$

$NLP中的句子级任务 nlp经典语句_nlp_45$

softmax结构

NLP中的句子级任务 nlp经典语句_nlp_46

本文的分值y为图中的z，本文的概率p为图中的y。

$NLP中的句子级任务 nlp经典语句_人工智能_15$ 中概率最大的那个 $NLP中的句子级任务 nlp经典语句_自然语言处理_16$ 所对应的那个词 $NLP中的句子级任务 nlp经典语句_网络层_17$ ，就是预测输出的词。

优化目标

交叉熵cross entropy loss

这里使用的是交叉熵cross entropy loss
$NLP中的句子级任务 nlp经典语句_人工智能_50$
其中 $NLP中的句子级任务 nlp经典语句_NLP中的句子级任务_51$ 为x的取值范围，多分类任务中代表类别。
这里有2个模型，一个x的真实模型，一个是构造的模型，我们希望构造的模型尽量接近真实模型。交叉熵越小，表示两个概率分布越靠近。p(x)为x的真实概率分布，q(x)为构造模型的概率分布。

NNLM模型的优化目标

$NLP中的句子级任务 nlp经典语句_网络层_52$
待优化的参数为： $NLP中的句子级任务 nlp经典语句_nlp_53$

对于一个输入样本 $NLP中的句子级任务 nlp经典语句_网络层_07$ 来说，真实概率为one-hot编码值，模型的预测概率为 $NLP中的句子级任务 nlp经典语句_人工智能_55$

示例

原文为：我/爱/中国/共产党，假设字典大小V=4

$NLP中的句子级任务 nlp经典语句_NLP中的句子级任务_09$
$NLP中的句子级任务 nlp经典语句_网络层_07$ 为：我/爱/中国
预测词 $NLP中的句子级任务 nlp经典语句_NLP中的句子级任务_36$ 为：共产党

词	one-hot编码
我	[1,0,0,0]
爱	[0,1,0,0]
中国	[0,0,1,0]
共产党	[0,0,0,1]

输入到NNLM模型中，最后得到的概率 $NLP中的句子级任务 nlp经典语句_网络层_59$

$NLP中的句子级任务 nlp经典语句_网络层_60$	概率值
$NLP中的句子级任务 nlp经典语句_自然语言处理_61$	0.1
$NLP中的句子级任务 nlp经典语句_自然语言处理_62$	0.1
$NLP中的句子级任务 nlp经典语句_网络层_63$	0.2
$NLP中的句子级任务 nlp经典语句_网络层_64$	0.6

$NLP中的句子级任务 nlp经典语句_NLP中的句子级任务_65$ 的概率最大，预测的词为：共产党

文章部分翻译

Abstract

pytorch API:

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：牛客SQL请添加断点后再开始调试Mysql sql设置断点

下一篇：android 发布数据安卓开发数据存储

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯