我们说了三个tokenize不同粒度:word/subword/char,现在最常用的是subword字词的模式,今天就和大家分享下字词的三个经典的算法:WordPiece、BPE/BBPE和unigram。
大家对于token的概念可能司空见惯了,现在的大语言模型的计费方式一般都采用输入和输出的token数量来计费。那到底什么是token,它的作用是什么?
Transformers介绍
Copyright © 2005-2024 51CTO.COM 版权所有 京ICP证060544号