LoRA 核心代码

原创

TechOnly 2023-06-24 09:44:58 博主文章分类：深度学习 ©著作权

©著作权归作者所有：来自51CTO博客作者TechOnly的原创作品，请联系作者获取转载授权，否则将追究法律责任

《LoRA: Low-Rank Adaptation of Large Language Models》 https://arxiv.org/abs/2106.09685

核心内容：验证了只微调～1%的参数的LLM微调方法，而不损失正确率

核心代码： https://github.com/huggingface/peft/blob/main/src/peft/tuners/lora.py

核心思想：用两个MLP矩阵[N * r] * [r * M] 代替 MLP矩阵[N * M]，进行微调的是两个小矩阵，把原来[N * M]的参数固定住，

原来的[N * M]参数被固定了没微调，这个方法为什么会有效？

因为两个矩阵[N * r] * [r * M] 和输入向量和输出向量和原来[N * M] 是add到一起的，所以预训练的信息也都在

相当于用两个小矩阵去学习小的微调数据集，同时保持原来的预训练信息不动

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯