大语言模型通过零样本进行时间序列预测

原创

AI论文_行麦科技 2024-07-17 19:06:35 博主文章分类：行麦科技 ©著作权

©著作权归作者所有：来自51CTO博客作者AI论文_行麦科技的原创作品，请联系作者获取转载授权，否则将追究法律责任

论文介绍了一种创新方法，利用大型语言模型（LLM）进行时间序列预测，无需额外训练。通过将时间序列数据转换为数字字符序列，预测问题转变为文本预测任务。作者通过改进标记化技术和增强模型对连续值的适应性来优化LLM的预测能力。LLM的优势在于它们能自然处理多模态分布，偏好简洁与重复模式，而且可以直接处理缺失数据，整合文本信息。

大语言模型通过零样本进行时间序列预测_模态

1 预测步骤

以下是利用LLM进行时间序列预测的具体：

（1）数据编码：首先，将时间序列数据转换为一系列数字字符，这样可以将时间序列预测问题转化为文本预测问题。例如，数值序列会被编码为“151, 167, ..., 267”这样的字符串格式。
（2）标记化处理：接下来，对编码后的数字字符串进行标记化。标记化是关键一步，因为它直接影响到模型如何理解和学习数据中的模式。不同的LLM采用不同的标记化策略，例如GPT-3通过在数字之间添加空格来创建每个数字的独立标记，而LLaMA-2则将数字标记为单个字符。正确的标记化对于模型的预测性能至关重要。
（3）生成预测：一旦数据被正确处理并标记化，就可以利用LLM生成预测。预测过程类似于文本生成，即模型根据输入序列预测下一个标记。由于LLM能够处理序列中的复杂模式，它们可以自然地捕捉时间序列中的季节性趋势和其他重复模式。
（4）不确定性估计：除了生成预测值，LLM还可以提供预测的不确定性估计，这对于高度随机的时间序列尤其重要。这可以通过采样预测并计算预测分布的统计量来实现。