lstm time series prediction github pytorch

原创

mob64ca12d4650e 2024-08-26 04:36:02 ©著作权

©著作权归作者所有：来自51CTO博客作者mob64ca12d4650e的原创作品，请联系作者获取转载授权，否则将追究法律责任

使用PyTorch实现LSTM时间序列预测

时间序列预测是机器学习中的一个重要应用领域。LSTM（长短期记忆网络）是一种强大的递归神经网络（RNN），适合处理和预测序列数据。本文将指导你如何使用PyTorch实现一个LSTM时间序列预测模型，并提供详细的步骤、代码示例及解释。

整体流程

我们将整个过程分为以下几个步骤：

步骤	描述
1	数据预处理：加载数据并进行处理，如归一化和分割训练集/测试集
2	构建LSTM模型：定义LSTM结构及前向传播
3	定义损失函数和优化器：选择适合的损失函数和优化算法
4	训练模型：执行多次迭代以优化模型参数
5	测试与评估：使用测试数据评估模型性能
6	预测：使用训练好的模型进行未来数据的预测

以下是每一步骤的具体实现。

1. 数据预处理

首先需要加载数据并进行预处理。通常包括填补缺失值、归一化和分割数据等步骤。

import numpy as np
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split

# 加载数据
data = pd.read_csv('your_time_series_data.csv')
# 假设数据集中有一列叫做'value'，我们要预测这一列
values = data['value'].values

# 归一化数据
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_data = scaler.fit_transform(values.reshape(-1, 1))

# 准备训练和测试数据，假设使用前80%的数据作为训练集
train_size = int(len(scaled_data) * 0.8)
train_data = scaled_data[:train_size]
test_data = scaled_data[train_size:]

注释说明

MinMaxScaler用于将数据归一化到[0, 1]区间。
train_test_split用于将数据集分为训练集和测试集。

2. 构建LSTM模型

在这一部分，我们将定义LSTM模型的架构。

import torch
import torch.nn as nn

class LSTMModel(nn.Module):
    def __init__(self, input_size, hidden_size, output_size):
        super(LSTMModel, self).__init__()
        self.lstm = nn.LSTM(input_size, hidden_size, batch_first=True)
        self.fc = nn.Linear(hidden_size, output_size)

    def forward(self, x):
        out, _ = self.lstm(x)
        out = self.fc(out[:, -1, :])  # 只取最后一个时间步的输出
        return out

# 创建模型实例
input_size = 1  # 特征数量
hidden_size = 50  # 隐藏层单元数量
output_size = 1  # 预测结果数量

model = LSTMModel(input_size, hidden_size, output_size)

注释说明

nn.LSTM构建LSTM层，而nn.Linear用于实现全连接层。
forward方法定义了模型的前向传播过程。

3. 定义损失函数和优化器

选择适合的损失函数和优化算法对模型的训练至关重要。

import torch.optim as optim

# 定义损失函数和优化器
criterion = nn.MSELoss()  # 均方误差损失
optimizer = optim.Adam(model.parameters(), lr=0.001)  # Adam优化器

注释说明

nn.MSELoss计算预测值与真实值之间的均方误差，适合回归问题。
optim.Adam是自适应学习率优化方法，它通常能提供较快的收敛速度。

4. 训练模型

在这一阶段，我们执行多次迭代以训练模型。

# 转换数据格式
def create_dataset(data, time_step=1):
    X, Y = [], []
    for i in range(len(data) - time_step - 1):
        a = data[i:(i + time_step), 0]
        X.append(a)
        Y.append(data[i + time_step, 0])
    return np.array(X), np.array(Y)

# 设置时间步
time_step = 10
X_train, y_train = create_dataset(train_data, time_step)
X_train = torch.from_numpy(X_train).float().view(-1, time_step, input_size)
y_train = torch.from_numpy(y_train).float()

# 训练模型
num_epochs = 100
for epoch in range(num_epochs):
    model.train()
    optimizer.zero_grad()
    outputs = model(X_train)
    loss = criterion(outputs, y_train.view(-1, 1))
    loss.backward()
    optimizer.step()
    
    if (epoch+1) % 10 == 0:
        print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

注释说明

create_dataset函数将时间序列数据转换为可以输入到LSTM的数据格式。
在每个训练周期中，我们清除优化器的梯度、执行前向传播、计算损失、反向传播以及更新参数。

5. 测试与评估

训练后，需要在测试集上评估模型表现。

model.eval（)
X_test, y_test = create_dataset(test_data, time_step)
X_test = torch.from_numpy(X_test).float().view(-1, time_step, input_size)
y_test = torch.from_numpy(y_test).float()

with torch.no_grad():
    test_outputs = model(X_test)
    test_loss = criterion(test_outputs, y_test.view(-1, 1))
    print(f'Test Loss: {test_loss.item():.4f}')

注释说明

model.eval（)将模型转换为评估模式，在此模式下，模型不更新参数，并且不会计算梯度。

6. 预测

最后，使用训练好的模型进行未来数据的预测。

# 使用模型进行预测
future_steps = 10
predictions = []

input_data = test_data[-time_step:].reshape(1, time_step, input_size)

for _ in range(future_steps):
    input_tensor = torch.from_numpy(input_data).float()
    with torch.no_grad():
        predicted = model(input_tensor)
        predictions.append(predicted.item())
        
    input_data = np.append(input_data[:, 1:, :], [[predicted.detach().numpy()]], axis=1)

# 逆归一化数据
predictions = scaler.inverse_transform(np.array(predictions).reshape(-1, 1))

注释说明

该段代码用于预测未来的时间序列数据，将模型输出的结果进行逆归一化处理，以恢复原始数据的尺度。

状态图

使用Mermaid语法呈现整个流程的状态图：

stateDiagram
    [*] --> 数据预处理
    数据预处理 --> 构建LSTM模型
    构建LSTM模型 --> 定义损失函数和优化器
    定义损失函数和优化器 --> 训练模型
    训练模型 --> 测试与评估
    测试与评估 --> 预测
    预测 --> [*]