NeuralProphet是一个python库,用于基于神经网络对时间序列数据进行建模。 它建立在PyTorch之上,并受到Facebook Prophet和AR-Net库的极大启发。

NeuralProphet 和 Prophet对比

从库名称中,您可能会问Facebook的Prophet库和NeuralProphet之间的主要区别是什么。 根据NeuralProphet的文档,增加的功能是[1]:

  • 使用PyTorch的Gradient Descent进行优化,使建模过程比Prophet快得多
  • 使用AR-Net建模时间序列自相关(也称为序列相关)
  • 自定义损失和指标
  • 具有前馈神经网络的可配置非线性层,
  • 等等

项目维护者

基于该项目的GitHub页面,该项目的主要维护者是斯坦福大学的Oskar Triebe,Facebook和莫纳什大学的合作。

安装

该项目处于测试阶段,因此,如果您要在生产环境中使用此库,我建议您谨慎使用。

不幸的是,在撰写本文时,该库没有pip或conda软件包。 只能通过克隆存储库并运行pip install。来安装它。但是,如果要在Jupyter Notebook环境中使用该软件包,则应安装其实时版本pip install . 这将提供更多功能,例如使用plot_live_loss()实时训练和验证损失。

git clone https://github.com/ourownstory/neural_prophet 
cd neural_prophet 
pip install .[live]

我建议创建一个新环境(conda或venv),并从新环境安装NeuralProphet软件包,让安装程序处理所有依赖项(它具有Pandas,Jupyter Notebook,PyTorch作为依赖项)。

现在我们已经安装了软件包,让我们开始吧!

案例分析实践

在这里,我使用在Kaggle上的2013年至2017年德里的每日气候数据。 首先,让我们导入主要包。

import pandas as pd 
from neuralprophet import NeuralProphet

然后,我们可以将数据读取到Panda DataFrame中。 NeuralProphet对象期望时间序列数据具有一个名为ds的日期列,而我们希望将其预测为y。

# Data is from https://www.kaggle.com/sumanthvrao/daily-climate-time-series-data 
df = pd.read_csv("./DailyDelhiClimateTrain.csv", parse_dates=["date"]) 
df = df[["date", "meantemp"]] 
df.rename(columns={"date": "ds", "meantemp": "y"}, inplace=True)

现在,让我们初始化模型,为NeuralProphet对象定义的所有默认参数,包括有关某些参数的其他信息。 这些是您可以在模型中配置的超参数。 当然,如果您打算使用默认变量,则只需执行model = NeuralProphet()。

# model = NeuralProphet() if you're using default variables below.
model = NeuralProphet(
    growth="linear",  # Determine trend types: 'linear', 'discontinuous', 'off'
    changepoints=None, # list of dates that may include change points (None -> automatic )
    n_changepoints=5,
    changepoints_range=0.8,
    trend_reg=0,
    trend_reg_threshold=False,
    yearly_seasonality="auto",
    weekly_seasonality="auto",
    daily_seasonality="auto",
    seasonality_mode="additive",
    seasonality_reg=0,
    n_forecasts=1,
    n_lags=0,
    num_hidden_layers=0,
    d_hidden=None,     # Dimension of hidden layers of AR-Net
    ar_sparsity=None,  # Sparcity in the AR coefficients
    learning_rate=None,
    epochs=40,
    loss_func="Huber",
    normalize="auto",  # Type of normalization ('minmax', 'standardize', 'soft', 'off')
    impute_missing=True,
    log_level=None, # Determines the logging level of the logger object
)

配置模型及其超参数后,我们需要训练模型并进行预测。 让我们对温度进行一年的预测。

metrics = model.fit(df, validate_each_epoch=True, freq="D") 
future = model.make_future_dataframe(df, periods=365, n_historic_predictions=len(df)) 
forecast = model.predict(future)

您可以通过调用model.plot(forecast)来简单地绘制预测,如下所示:

fig, ax = plt.subplots(figsize=(14, 10)) 
model.plot(forecast, xlabel="Date", ylabel="Temp", ax=ax)
ax.set_title("Mean Temperature in Delhi", fontsize=28, fontweight="bold")

时间序列神经网络有哪些 时间序列神经网络建模_pytorch

上面显示了一年的预测图,其中从2017-01-01到2018-01-01之间的时间段是预测。 可以看出,预测图类似于历史时间序列。 它既捕获了季节性,又捕获了线性趋势的缓慢增长。

也可以通过调用model.plot_parameters()来绘制参数。

时间序列神经网络有哪些 时间序列神经网络建模_时间序列分析_02

使用平均绝对误差(MAE)的模型损失如下图所示。 您也可以使用“平滑的L1损失”功能。

fig, ax = plt.subplots(figsize=(14, 10))
ax.plot(metrics["MAE"], 'ob', linewidth=6, label="Training Loss")  
ax.plot(metrics["MAE_val"], '-r', linewidth=2, label="Validation Loss")
# You can use metrics["SmoothL1Loss"] and metrics["SmoothL1Loss_val"] too.

时间序列神经网络有哪些 时间序列神经网络建模_神经网络_03

总结

在本文中,我们讨论了NeuralProphet,这是一个基于神经网络对时间序列进行建模的python库。 该库使用PyTorch作为后端。 作为案例研究,我们为德里的每日气候时间序列数据创建了一个预测模型,并进行了一年的预测。 使用此库的一个优点是其语法与Facebook的Prophet库类似。