文本生成模型评价指标

关注 goody

文章目录

摘要
研究动机
方法
任务公式
多规模文本表示
模型整体架构
损失函数

文本生成模型评价指标

转载

goody 2024-10-02 09:21:54

文章标签 文本生成模型评价指标 bert 学习深度学习数据集 文章分类 深度学习人工智能

摘要

在AES领域，预训练的语言模型没有被很适合地应用，来超过比如LSTM之类的深度学习方法。
本文介绍了一个新的基于BERT的多规模的文本表示模型，它能够被联合学习。我们也应用了多损失和来自其他领域文章的迁移学习来进一步提升性能。
本文的方法在ASAP数据集上取得了state-of-the-art的结果，并且提出的多规模文本表示在CRP数据集上的泛化结果也很好。

研究动机

当老师对一篇文章进行打分时，分数会受到多粒度级别的信号的影响，比如词级、句级和段落级等。
本文主要贡献如下：

方法

任务公式

AES任务被定义如下：
给出一个有 $文本生成模型评价指标_bert$ 个词的文本，我们需要输出一个分数 $文本生成模型评价指标_文本生成模型评价指标_02$

多规模文本表示

我们从三个规模获得多规模的文本表示：token规模，分段规模（segment）和文档规模。
Token规模和文档规模的输入：应用了一个预训练的BERT模型来得到token-scale和document-scale的文本表示。BERT标注器被用来将一篇文章分割成token序列 $文本生成模型评价指标_文本生成模型评价指标_03$ ，token都指的是词片（WordPiece），它是由BERT使用的一个子词标注算法来获得的。我们从序列 $文本生成模型评价指标_bert_04$ 构建了一个新的序列 $文本生成模型评价指标_bert_05$ ：

最终的输入表示是以下3个嵌入的和：token嵌入，segmentation嵌入，position嵌入。
Token级别和文档级别的表示：
分段级别的表示：

模型整体架构

文本生成模型评价指标_文本生成模型评价指标_06

损失函数

一个老师在打分时，考虑到所有学生的整体水平的分布。根据这一直觉，本文引入 SIM 损失到 AES 任务中。
在每个训练步骤中，我们将batch中的文章被预测的分数作为一个预测向量 $文本生成模型评价指标_文本生成模型评价指标_02$ ，SIM 损失奖励相似的向量对，来使得模型考虑到文章batch之间的相互关系。
MR度量了batch中每个文章对的排序顺序。我们直觉上引入MR损失，因为文章之间的排序属性是一个打分的关键因素。
对于文章的每个batch，我们首先枚举了所有的文章对，之后计算MR向下面这样计算MR损失，ME损失尝试使得模型惩罚错误的顺序。

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

赞
收藏
评论
分享
举报

上一篇：spring构造器引入的对象为null

下一篇：linux 使用go语言编译

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
训练营
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册