nlp 机器学习深度学习 nlp机器人

转载

mob64ca14048514 2023-08-21 18:13:33

文章标签 nlp 机器学习深度学习相似度评价指标特征向量 文章分类 NLP 人工智能

机器人NLP模型介绍

1. 预训练模型

首先试验了以下三个预训练模型在语义相似度任务上的效果：

hfl-chinese-roberta-wwm-ext
hfl-chinese-roberta-wwm-ext-large
bert-base-chinese

处于效率的考虑，进行语义相似度任务的时候不是将两个语句拼接传入模型再通过[CLS]位置对应的值作为其相似度，而是通过计算两个语句的特征向量，然后通过余弦相似度作为他们的相似度表征。

最后根据测试的效果使用了hfl-chinese-roberta-wwm-ext作为我们的预训练模型

2. 训练方法

我们参考Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks这个论文中使用孪生网络的训练方法来训练BERT，使其能在语义相似度任务上取得较好的成绩。

我们首先根据论文中的训练方法将roberta模型在lcqmc以及nli语料库上进行了微调，微调后的模型在语义相似度任务上已经具有较好的效果。

接着我们考虑减小模型的体积，为此，我从模型中抽出了1，4，7，10层来构成一个新的模型，接着使用模型蒸馏的方法来使得这个小模型能具有与原先模型差不多的效果。模型蒸馏过程中使用到的数据集包括lcqmc、nli以及tnews。

3. 模型使用

对于训练好的模型，我们将语句传入模型得到输出再经过一层mean pooling作为其特征向量。然后通过计算两个特征向量之间的余弦相似度来表示两个语句之间的相似度。

模型评价指标

1. 基本概念

nlp 机器学习深度学习 nlp机器人_nlp 机器学习深度学习

2. 语料库

在训练过程中一共使用了一下语料库

lcqmc
xnli
tnews

名称	训练集	验证集	测试集
lcqmc	238766	8802	12500
xnli	392702	2490	5010

3. 评价指标

3.1 距离

nlp 机器学习深度学习 nlp机器人_nlp 机器学习深度学习_02

3.2 pearson相关系数

通过计算距离与标签相关系数作为模型的评价指标。

在以下部分，通过distance表示上面所示四个距离中的某一个

nlp 机器学习深度学习 nlp机器人_评价指标_03

4. 当前所使用模型的评价分数

distillation-sts_2021-05-28_17-33-59

评价指标	分数
cosine_pearson	0.7560853342352258
euclidean_pearson	0.790755951697049
manhattan_pearson	0.7905980256878025
dot_pearson	0.7500113350858096

roberta-zh-nli-sts-2021-05-27_12-43-40

评价指标	分数
cosine_pearson	0.7666978395294516
euclidean_pearson	0.804099045672043
manhattan_pearson	0.8039674474113313
dot_pearson	0.7645833655053875

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：Android string 改变指定字符串 android string format

下一篇：java xml中自动注入 xml注入器是什么

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯