Baihai_IDP的博客_IDP Meetup,技术干货,IDP

RLHF 技术：如何能更有效？又有何局限性？

编者按：自ChatGPT推出后，基于人类反馈的强化学习(RLHF)技术便成为大模型构建和应用人员关注的热点。但该方法一些情况下效果却差强人意，有些基础模型经RLHF调优后反而表现更差。RLHF技术的适用性和具体操作细节似乎成谜。这篇文章探讨了基于人类反馈的强化学习(RLHF)的工作机制，分析了RLHF的三个关键组成部分：基础模型、偏好模型和强化学习。并总结了RLHF的局限性：无法纠正事实错误或添加

白海科技

大语言模型

人工智能

RLHF

深度学习

原创 2023-07-31 09:54:43 138 阅读

LLM Data Pipelines: 解析大语言模型训练数据集处理的复杂流程

编者按：在训练大语言模型的过程中,构建高质量的训练数据集是非常关键的一步，但关于构建大模型训练所需数据集的通用数据处理流程（Data pipelines)的相关资料极为稀少。本文主要介绍了基于Common Crawl数据集的数据处理流程。首先,文章概述了Common Crawl的不同数据格式WARC、WAT和WET的区别及应用场景。然后,文章详细阐述了数据处理流程的几个关键步骤,包括从数据源获取数

语言模型

大模型

白海科技

数据集处理

人工智能

原创 2023-07-25 09:52:25 309 阅读

Prompt Learning: ChatGPT 也在用的 NLP 新范式

自GPT-3以来，大语言

人工智能

自然语言处理

ChatGPT

深度学习

nlp

翻译 2023-07-24 20:56:05 89 阅读

大语言模型评估全解：评估流程、评估方法及常见问题

编者按：随着对大语言模型（LLM）评估领域的深入研究，我们更加清楚地认识到全面理解评估过程中的问题对于有效评估LLM至关重要。本文探讨了机器学习模型评估中出现的常见问题，并深入研究了LLM对模型评估领域带来的重大挑战。在评估方法方面，我们将其划分为直接评估指标、基于辅助模型的评估和基于模型的评估。本文还强调了审慎观察复杂评估指标和注意细节的重要性。以下是译文，Enjoy!作者 |&nbs

大模型

大模型评估

LLMOps

白海科技

人工智能

原创 2023-07-17 10:41:17 570 阅读

AIGC神器CLIP：技术详解及应用示例

上一期，我们介绍了Diffusion模型的发展历程、核心原理及其对AIGC发展的推动

stable diffusion

深度学习

人工智能

算法

ai

原创精选 2023-07-12 15:09:30 556 阅读

落地领域大模型应知必会(2): 轻量化微调

编者按：在实际部署大模型的过程中可能会面临资源限制的问题。通过轻量化大模型微调技术，可以将大型预训练语言模型适配到特定领域、特定任务，并减小其模型尺寸和计算量需求，提高性能和效率。在上一篇文章中，我们分享了大语言模型的主要微调技术总览。接下来，本文将介绍轻量化大模型微调技术，重点关注Prompt Tuning和Prefix Tuning。以下是译文，Enjoy!本文经原作者授权，由Baihai I

大模型微调

ChatGPT

人工智能

白海科技

深度学习

原创 2023-07-10 10:07:52 213 阅读 yyds干货盘点

落地领域大模型应知必会 (1) ：主要微调方法总览

编者按：随着大规模预训练模型的发展和应用，大模型微调技术已经在很多领域都有了突破性的进展，并推动了人工智能技术的发展与应用。本文会简要介绍上下文学习（in-context learning）的含义，并介绍对LLMs进行微调的各种可行方式。还能够帮助我们了解如何选择大语言模型的微调方法。快快阅读此文，开启一趟大模型微调学习之旅吧！以下是译文，Enjoy!本文经原作者授权，由Baihai IDP编译。

语言模型

白海科技

大模型微调

人工智能

深度学习

原创精选 2023-07-03 10:07:16 384 阅读

落地领域大模型应知必会 (1) ：主要微调方法总览

编者按：随着大规模预训练模型的发展和应用，大模型微调技术已经在很多领域都有了突破性的进展，并推动了人工智能技术的发展与应用。本文会简要介绍上下文学习（in-context learning）的含义，并介绍对LLMs进行微调的各种可行方式。还能够帮助我们了解如何选择大语言模型的微调方法。快快阅读此文，开启一趟大模型微调学习之旅吧！以下是译文，Enjoy!本文经原作者授权，由Baihai IDP编译。

语言模型

白海科技

大模型微调

人工智能

深度学习

原创精选 2023-07-03 10:07:16 296 阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

Baihai_IDP的博客