【机器学习】时序预测必知的的统一Benchmarking框架

转载

机器学习初学者 2024-01-18 11:02:44

作者：Jan B ˛aczek,Dmytro Zhylko 等人

TSPP: A Unified Benchmarking Tool for Time-series Forecasting！

简介

【机器学习】时序预测必知的的统一Benchmarking框架_数据

尽管机器学习取得了显著进展，但主要的重点一般都还是放在数据获取以及构建模型上。然而，在真实世界环境中，我们需要一个标准化的能全面评估机器学习解决方案，这个在时序问题中更为重要，因为不同的环境条件妨碍了对各种方法进行有意义的比较。

所以本文我们介绍一个统一的基准框架，开发时间序列预测模型涉及的关键建模和机器学习决策。该框架可以使模型和数据集进行无缝集成。我们在这个框架内对最近提出的模型进行了基准测试，结果表明，精心设计的深度学习模型可以与需要大量特征工程和专业知识的梯度提升决策树相媲美，而且只需很少的工作量。

该框架逻辑很经典，目前很多朋友在处理类似问题时也都会用到类似的框架，是非常经典且有意义的。

核心框架

【机器学习】时序预测必知的的统一Benchmarking框架_数据_02

【机器学习】时序预测必知的的统一Benchmarking框架_人工智能_03

- 数据：为改善数据并将其转化为用于模型训练的格式。这其中包括数据选择、整理和清洗等。

- 训练：针对输入数据和模型所做的决策，以改善下游性能。这包括针对输入数据的模型设计、优化和选择标准。•

- 推理：针对部署和对未见数据输入进行预测所做的决策。

- 调节器：一旦上述组件被定义，该组件选择顶级配置并将其用于部署后的模型监控、重新训练和不确定性量化。

实验

【机器学习】时序预测必知的的统一Benchmarking框架_机器学习_04

【机器学习】时序预测必知的的统一Benchmarking框架_数据_05

【机器学习】时序预测必知的的统一Benchmarking框架_人工智能_06

DeepAR，尽管在单独训练时表现不佳（例如WikiTraffic数据集），但在集成模型中展现出了显著的转变。如上表所示，利用DeepAR的集成模型相比其他模型取得了显著优越的性能。这一有趣的发现突显了看似Weak的模型在集成配置中作为强大基准的潜力。通过利用各个模型的不同优势，集成模型可以共同实现更优越的性能，即使一些组件在单独运行时表现不佳。

小结

【机器学习】时序预测必知的的统一Benchmarking框架_数据集_07