SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models

关注 Facico

文章目录

Smoothness-inducing Adversarial Regularization
Bregman Proximal Point Optimization
最终
实验
总结

SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models

原创

Facico 2022-12-26 18:13:16 ©著作权

文章标签 SMART 正则化机器学习深度学习 NLP对抗 文章分类 虚拟化云计算

©著作权归作者所有：来自51CTO博客作者Facico的原创作品，请联系作者获取转载授权，否则将追究法律责任

SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models through Principled RegularizedOptimization

Smoothness-inducing Adversarial Regularization

fine-tunning的优化如下
$SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_深度学习$

$SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_正则化_02$ 是fine-tunning参数
$SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_机器学习_03$ 是Smoothness-inducing Adversarial正则项

$SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_机器学习_04$
$SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_机器学习_05$ 就是描述两个分布相似度的
如果是回归模型就把上面的 $SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_SMART_06$ 改成 $SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_SMART_07$

这里大致参照了VAT中，将对抗的地方设置为正则项，来平滑数据点，可以参见VAT。

这样使得在一定的扰动下，输出一样的分布，增强模型的鲁棒性

Bregman Proximal Point Optimization

我们使用类Bregman Proximal Point Optimization的方式来解决上面fine-tunning的优化，每次迭代的时候将入一个强惩罚项来避免模型调整过激，让模型学习到的流行更加光滑，让loss呈线性变化，增强对扰动的抵抗能力，避免灾难性遗忘。
$SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_NLP对抗_08$
加入动量加速
$SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_正则化_09$
就是做个滑动平均， $SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_深度学习_10$ 是动量参数

最终

最终的损失函数为
$SMART: Robust and Efficient Fine-Tuning for Pre-trainedNatural Language Models_深度学习_11$
伪代码如上

实验

集成模型上，用这些fine-tunning后，结合MT-DNN达到当时的SOTA
单模型上，和RoBERTa结合达到SOTA

总结

论文非常精短，但是效果却很好
提供了NLP对抗性训练的新思路，尤其是fine-tunning的思路，加入对抗性正则项这个思路，能对后续工作有较大启发

赞
收藏
评论
分享
举报

上一篇：Unsupervised Text Generation by Learning from Search(TGLS)

下一篇：Virtual Adversarial Training(VAT)

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

举报文章

请选择举报类型

内容侵权涉嫌营销内容抄袭违法信息其他

具体原因

包含不真实信息涉及个人隐私

原文链接（必填）

补充说明

0/200

上传截图

格式支持JPEG/PNG/JPG，图片不超过1.9M

已经收到您得举报信息，我们会尽快审核

鸿蒙开发者社区

WOT技术大会

公众号矩阵

移动端

短视频免费课程课程排行直播课软考学堂

全部课程厂商认证 IT技术 24年11月软考 PMP项目管理免费题库

在线学习

文章资源问答课堂专栏直播

51CTO

鸿蒙开发者社区

51CTO技术栈

51CTO官微

51CTO学堂

51CTO博客

CTO训练营

鸿蒙开发者社区订阅号

51CTO软考

51CTO学堂APP

51CTO学堂企业版APP

鸿蒙开发者社区视频号

51CTO软考题库

51CTO博客

首页
关注
排行榜
精品课程
免费直播
软考题库

科目全、试题精、讲解专业，扫码免费刷

搜索历史清空

热门搜索

查看【】的结果
写文章
创作中心
登录注册