LLMs_51CTO博客

The Era of 1-bit LLMs

表 1 总结了 BitNet b1.58 和 LLaMA LLM 的困惑度和成本：在困惑度方面，当模型大小为 3B 时，BitNet b1.58 开始与全精度 L泛使用，但并不是最优的。

人工智能

语言模型

基线

权重

原创

qq6669490e54384

1月前

22阅读

开源大语言模型LLMs汇总

向AI转型的程序员都关注了这个号????????????大语言模型大tGPT模型用于...

语言模型

人工智能

自然语言处理

github

深度学习

转载

datayx

2023-07-24 08:10:12

142阅读

语言大模型（LLMs）的特点

语言大模型(Large Language Models, LLMs)是近年来自然语言处理领域的重要发展之一。其主要特点是: 海量参数:LLM

数据

自然语言处理

网络架构

原创

Lucky_Syw

8月前

152阅读

One Person + LLMs = 网文照进现实

三鹿是微软SENIOR SOFTWARE ENGINEER，平时很喜欢看小说，是一位资深的小说网文达人，在做这个项目之前，做过小说爬虫，使用S

人工智能

ide

关键帧

转载

YJL

6月前

18阅读

AIGC包含LLMS吗 aic范围

设计的本质是抽象变化。关于Composites的用法又有了新的认识：在Task返回值的时候尽量要与真实情况相符合，就像Selector下的子节点一旦成功Selector就返回，说明Selector是一种选择的方式，而Sequence下的子节点一旦失败就返回，说明它就是用来一步一步执行的。所以在选择使用的时候尽量按照规矩来，减少强制性的返回结果，这样显得更和谐，别人读程序也更好懂。 &nb

AIGC包含LLMS吗

数据

赋值

实例化

转载

mob6454cc76bc4a

2月前

12阅读

NLP / LLMs中的Temperature 是什么?

Temperature 参数是语言生成模型中一个重要的超参数，可用于控制生成文本的随机性和创造性。通过调整该参数，可以生成

自然语言处理

深度学习

chatgpt

gpt3

语言模型

原创

deephub

3月前

39阅读

在本地运行 LLMs 的 6 种方法

探索LLMs本地运行方案

人工智能

chatgpt

LLM

开源

原创

Seal软件

6月前

129阅读

API-Bank: A Benchmark for Tool-Augmented LLMs

Recent research has shown that Large Language Models (LLMs) can utilize external tools to improve their contextual processing abilities, moving away from the pure language modeling paradigm and paving

API

Augmented

lua

原创

qq5f2bca2ab6e17

2023-08-19 00:04:00

277阅读

快速上手Prompt，让你的LLMs更智能

在当前社会中，随着AIGC的盛行，使用好prompt可以让自己更上一层楼。今天，我将通过星火大模型重新认识prompt设计，并与大家分享一些使用技巧。如果你想体验星火大模型的强大魅力，请登录https://xinghuo.xfyun.cn/desk ，即可免费体验。星火大模型是由科大讯飞研发的一款大语言模型。它具备强大的中文创作能力，可以处理复杂语境下的逻辑推理，并能可靠地执行各种任务。在使用星火大模型时，合理使用prompt是至关重要的，因为它可以大大提高模型的效果和准确性。因此，本文将从prompt的生成和prompt的重要性等角度，分析星火大模型中prompt的使用方法。

语言模型

Personal

开发者

原创

努力的小雨

8月前

88阅读

Chart-based Reasoning: Transferring Capabilities from LLMs to VLMs

本文提出了一种技术，将大型语言模型（LLMs）的能力转移到视觉语言模型（VLMs）上。尽管VLMs在多模态任务上的表现越来越强，但其推理能力，尤其是小型VLMs的推理能力仍然受限。我们的方法在最近引入的ChartQA上取得了最先进的性能，并且在PlotQA和FigureQA上也展现出了更好的性能。我们首先通过改进图表到表格的翻译任务来提升图表表示，然后在原始训练集的基础上构建了一个比原来大20倍的数据集。为了提高通用推理能力和改善数值运算，我们使用图表的表格表示来合成推理路径。

多任务

数据集

语言模型

原创

liferecords

5月前

52阅读

《关于 LLMs 自我纠错的关键调研》论文解析

Large language models（LLMs）在自然语言处理领域取得了显著进展，但它们仍然会产生错误。自我纠错（self - correction）是一种提高 LLMs 响应质量的方法，通过在推理过程中使用 LLMs 来改进响应。然而，关于 LLMs 何时能够成功自我纠错，目前尚无定论。本文对相关研究进行了批判性调研，探讨了成功自我纠错所需的条件。一、研究背景自我纠错是通过在推理过程中使用

语言模型

数据

外部工具

原创

智能交互引擎

8天前

52阅读

LLMs 能否胜任「数据标注」？机遇与挑战并存

编者按：目前，LLMs 在机器翻译、文本生成、多轮问答等任务上已表现得非常出色了。人们开始思考它们是否也可以用于数据标注工作。数据标注是训练和评估各种机器学习模型的基础，一直是一项昂贵且耗时的工作。是否能够借助 LLMs 的强大能力来为数据标注流程降本增效呢？本文深入探讨了这一问题。本文作者从业界最新研究入手，全面评估了 LLMs 在数据标注领域的应用前景。文章指出，在某些场景下使用 LLMs

AI

LLMs

原创精选

Baihai_IDP

3月前

170阅读

Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference

Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference 相关链接：arxiv 关键字：Large Language Models、LLMs、Human Preference、Chatbot Arena、Benchmark Platform 摘要随着大型语言模型（LLMs）解锁新功能和应用，评估它们与人类偏

众包

数据

基准测试

原创

liferecords

5月前

84阅读

Long-context LLMs Struggle with Long In-context Learning

大型语言模型（LLMs）在处理超过32K个token的长序列方面取得了显著进展。然而，它们的性能评估主要局限于诸如困惑度和合成任务等指标，这些指标可能无法充分捕捉它们在更微妙、现实世界场景中的能力。本研究引入了一个专门的基准测试（LongICLBench），专注于极端标签分类领域内的长上下文学习。我们精心选择了六个数据集，标签范围从28到174个类别，涵盖了从2K到50K个token的不同输入（少量示例演示）长度。我们的基准测试要求LLMs理解整个输入，以识别庞大的标签空间，从而做出正确的预测。

基准测试

数据集

语言模型

原创

liferecords

4月前

38阅读

AIGC和LLMs区别 gcc与llvm的区别

在此，把C++在不同编译器，即VC++与GCC（或LLVM）上的一些区别记录下来，以备查阅。（注：以下VC++均是指VC++ 10.）基本数据类型、const关键字1. 基本数据类型的大小 C++基本数据类型的大小对比 WindowsmacOS/Linuxwchar_t16 bits32 bitslong32 bits64 bits影响：对程序在文件的保存和读取上可能会造成问题

AIGC和LLMs区别

LLVM

构造函数

虚函数

转载

mob64ca14048514

5月前

32阅读

研究LLMs之前，不如先读读这五篇论文！

论文链接：https://gwern.net/doc/www/s3-us-west-2.amazonaws.com/d73fdc5ffa8627bce44dcda2fc012da638ffb158.pdf。论文链接

深度学习

人工智能

机器学习

Machine

bc

原创

wx6464351503832

2023-05-17 10:30:16

64阅读

LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement

预训练的大型语言模型（LLMs）目前是解决绝大多数自然语言处理任务的最新技术。尽管许多实际应用仍然需要微调以达到令人满意的性能水平，但许多应用处于低数据量状态，这使得微调变得具有挑战性。为了解决这个问题，我们提出了LLM2LLM，这是一种针对性和迭代式的数据增强策略，它使用教师LLM通过增加可用于特定任务微调的数据来增强小型种子数据集。

LLM

大语言模型

少样本学习

数据增强

原创

liferecords

5月前

112阅读

大语言模型(LLMs)和新兴机器学习技术栈

编者按：过去，NLP开发人员依赖于文本分类、命名实体识别和命名实体消歧等技术栈来优化NLP任务。然而，随着大语言模型(LLM)的快速发展，新的技术栈开始出现，以支持和加速这些大型语言模型的实现和应用。让我们一起跟随Langchain的开发者，共同探讨LLM及NLP技术栈正在发生的变化，以及这一系列变化对开发者的意义。以下是译文，Enjoy! 作者 | Harrison Chase &am

技术栈

数据

语言模型

原创精选

Baihai_IDP

2023-03-20 10:44:49

634阅读

让LLMs在结构化数据上推理-StructGPT

StructGPT旨在研究如何在大型语言模型中统一提高其在结构化数据上的零样本推理能力。其通过使用迭代阅读-推理（IRR）的方式来解决基于结构化数据的问答任务，提出的IRR的方法可以通过构建专门的函数从结构化数据中收集相关证据（即“阅读”），并让大型语言模型集中推理任务，以收集的信息为基础进行推理（即“推理”）。1 迭代阅读推理(IRR)StructGPT的主要创新在于其统一的框架设计，使得LLM

结构化

数据

迭代

原创

AI论文_行麦科技

2月前

20阅读

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

51CTO博客

LLMs

The Era of 1-bit LLMs

开源大语言模型LLMs汇总

语言大模型（LLMs）的特点

One Person + LLMs = 网文照进现实

AIGC包含LLMS吗 aic范围

NLP / LLMs中的Temperature 是什么?

在本地运行 LLMs 的 6 种方法

API-Bank: A Benchmark for Tool-Augmented LLMs

快速上手Prompt，让你的LLMs更智能

Chart-based Reasoning: Transferring Capabilities from LLMs to VLMs

《关于 LLMs 自我纠错的关键调研》论文解析

LLMs 能否胜任「数据标注」？机遇与挑战并存

Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference

Long-context LLMs Struggle with Long In-context Learning

AIGC和LLMs区别 gcc与llvm的区别

研究LLMs之前，不如先读读这五篇论文！

LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement

大语言模型(LLMs)和新兴机器学习技术栈

让LLMs在结构化数据上推理-StructGPT

压缩大型语言模型(LLMs):缩小10倍、性能保持不变

大型语言模型（LLMs）在AIGC中的核心地位

用 AI 取代人工？或许 LLMs 可以给你答案

大语言模型(LLMs)和新兴机器学习技术栈

【大模型数据增强】LLMAAA：使用 LLMs 作为数据标注器

AI大模型企业应用实战(10)-LLMs和Chat Models

快速掌握LLMs炼金术，必读Prompt Engineering实践技巧

大语言模型（LLMs）在 Amazon SageMaker 上的动手实践

7种RAG工具，让你的LLMs发挥最大效用

AI视频教程下载：用LangChain开发 ChatGPT和 LLMs 应用

51CTO博客

LLMs

The Era of 1-bit LLMs

开源大语言模型LLMs汇总

语言大模型（LLMs）的特点

One Person + LLMs = 网文照进现实

AIGC包含LLMS吗 aic范围

NLP / LLMs中的Temperature 是什么?

在本地运行 LLMs 的 6 种方法

API-Bank: A Benchmark for Tool-Augmented LLMs

快速上手Prompt，让你的LLMs更智能

Chart-based Reasoning: Transferring Capabilities from LLMs to VLMs

《关于 LLMs 自我纠错的关键调研》论文解析

LLMs 能否胜任「数据标注」？机遇与挑战并存

Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference

Long-context LLMs Struggle with Long In-context Learning

AIGC和LLMs区别 gcc与llvm的区别

研究LLMs之前，不如先读读这五篇论文！

LLM2LLM: Boosting LLMs with Novel Iterative Data Enhancement

大语言模型(LLMs)和新兴机器学习技术栈

让LLMs在结构化数据上推理-StructGPT

压缩大型语言模型(LLMs):缩小10倍、性能保持不变

大型语言模型（LLMs）在AIGC中的核心地位

用 AI 取代人工？或许 LLMs 可以给你答案

大语言模型(LLMs)和新兴机器学习技术栈

【大模型 数据增强】LLMAAA：使用 LLMs 作为数据标注器

AI大模型企业应用实战(10)-LLMs和Chat Models

快速掌握LLMs炼金术，必读Prompt Engineering实践技巧

大语言模型（LLMs）在 Amazon SageMaker 上的动手实践

7种RAG工具，让你的LLMs发挥最大效用

AI视频教程下载：用LangChain开发 ChatGPT和 LLMs 应用

【大模型数据增强】LLMAAA：使用 LLMs 作为数据标注器