【LSTM回归预测】基于长短期记忆网络的数据回归预测附matlab完整代码

原创

matlab科研助手 2023-07-12 16:16:11 ©著作权

©著作权归作者所有：来自51CTO博客作者matlab科研助手的原创作品，请联系作者获取转载授权，否则将追究法律责任

✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。
🍎个人主页：Matlab科研工作室
🍊个人信条：格物致知。
更多Matlab仿真内容点击👇
智能优化算法神经网络预测雷达通信无线传感器电力系统
信号处理图像处理路径规划元胞自动机无人机

⛄ 内容介绍

长短期记忆网络（Long Short-Term Memory，LSTM）是一种常用于处理序列数据的循环神经网络（Recurrent Neural Network，RNN）的变种。相比传统的RNN，LSTM能够更好地解决长期依赖问题，具有较强的记忆能力。

LSTM通过引入门控机制来控制信息的流动和遗忘，从而实现对长期依赖关系的建模。其核心思想是使用门控单元来控制信息的输入、输出和遗忘，包括遗忘门、输入门和输出门。

LSTM的基本结构如下：

输入门（Input Gate）：决定是否将当前输入信息纳入记忆中。由一个sigmoid激活函数和一个点乘操作组成。输入门的输出范围在0到1之间，0表示完全忽略当前输入，1表示完全保留当前输入。
遗忘门（Forget Gate）：决定是否从记忆中删除某些信息。同样由一个sigmoid激活函数和一个点乘操作组成。遗忘门的输出范围在0到1之间，0表示完全忘记先前的记忆，1表示完全保留先前的记忆。
记忆单元（Memory Cell）：用于存储和传递先前的记忆信息。通过遗忘门和输入门来控制信息的删除和添加。
输出门（Output Gate）：决定当前时刻的输出。由一个sigmoid激活函数和一个点乘操作组成。输出门的输出范围在0到1之间，控制着记忆单元中的信息如何影响当前时刻的输出。

通过这些门控机制，LSTM可以选择性地保留、遗忘和输出信息，实现对长期依赖关系的建模。这使得LSTM在许多序列数据任务中取得了优秀的表现，如机器翻译、语音识别、文本生成等。

⛄ 代码

%%  清空环境变量
warning off             % 关闭报警信息
close all               % 关闭开启的图窗
clear                   % 清空变量
clc                     % 清空命令行

%%  导入数据
res = xlsread('数据集.xlsx');

%%  划分训练集和测试集
temp = randperm(103);

P_train = res(temp(1: 80), 1: 7)';
T_train = res(temp(1: 80), 8)';
M = size(P_train, 2);

P_test = res(temp(81: end), 1: 7)';
T_test = res(temp(81: end), 8)';
N = size(P_test, 2);

%%  数据归一化
[P_train, ps_input] = mapminmax(P_train, 0, 1);
P_test = mapminmax('apply', P_test, ps_input);

[t_train, ps_output] = mapminmax(T_train, 0, 1);
t_test = mapminmax('apply', T_test, ps_output);

%%  数据平铺
P_train =  double(reshape(P_train, 7, 1, 1, M));
P_test  =  double(reshape(P_test , 7, 1, 1, N));

t_train = t_train';
t_test  = t_test' ;

%%  数据格式转换
for i = 1 : M
    p_train{i, 1} = P_train(:, :, 1, i);
end

for i = 1 : N
    p_test{i, 1}  = P_test( :, :, 1, i);
end

%%  创建模型
layers = [
    sequenceInputLayer(7)               % 建立输入层
    
    lstmLayer(4, 'OutputMode', 'last')  % LSTM层
    reluLayer                           % Relu激活层
    
    fullyConnectedLayer(1)              % 全连接层
    regressionLayer];                   % 回归层
 
%%  参数设置
options = trainingOptions('adam', ...      % Adam 梯度下降算法
    'MaxEpochs', 1500, ...                 % 最大迭代次数
    'InitialLearnRate', 0.01, ...          % 初始学习率为 0.01
    'LearnRateSchedule', 'piecewise', ...  % 学习率下降
    'LearnRateDropFactor', 0.1, ...        % 学习率下降因子
    'LearnRateDropPeriod', 1200, ...       % 经过 1200 次训练后 学习率为 0.01 * 0.1
    'Shuffle', 'every-epoch', ...          % 每次训练打乱数据集
    'Plots', 'training-progress', ...      % 画出曲线
    'Verbose', false);

%%  训练模型
net = trainNetwork(p_train, t_train, layers, options);

%%  仿真预测
t_sim1 = predict(net, p_train);
t_sim2 = predict(net, p_test );

%%  数据反归一化
T_sim1 = mapminmax('reverse', t_sim1, ps_output);
T_sim2 = mapminmax('reverse', t_sim2, ps_output);

%%  均方根误差
error1 = sqrt(sum((T_sim1' - T_train).^2) ./ M);
error2 = sqrt(sum((T_sim2' - T_test ).^2) ./ N);

%%  查看网络结构
analyzeNetwork(net)

%%  绘图
figure
plot(1: M, T_train, 'r-*', 1: M, T_sim1, 'b-o', 'LineWidth', 1)
legend('真实值', '预测值')
xlabel('预测样本')
ylabel('预测结果')
string = {'训练集预测结果对比'; ['RMSE=' num2str(error1)]};
title(string)
xlim([1, M])
grid

figure
plot(1: N, T_test, 'r-*', 1: N, T_sim2, 'b-o', 'LineWidth', 1)
legend('真实值', '预测值')
xlabel('预测样本')
ylabel('预测结果')
string = {'测试集预测结果对比'; ['RMSE=' num2str(error2)]};
title(string)
xlim([1, N])
grid

%%  相关指标计算
% R2
R1 = 1 - norm(T_train - T_sim1')^2 / norm(T_train - mean(T_train))^2;
R2 = 1 - norm(T_test  - T_sim2')^2 / norm(T_test  - mean(T_test ))^2;

disp(['训练集数据的R2为：', num2str(R1)])
disp(['测试集数据的R2为：', num2str(R2)])

% MAE
mae1 = sum(abs(T_sim1' - T_train)) ./ M ;
mae2 = sum(abs(T_sim2' - T_test )) ./ N ;

disp(['训练集数据的MAE为：', num2str(mae1)])
disp(['测试集数据的MAE为：', num2str(mae2)])

% MBE
mbe1 = sum(T_sim1' - T_train) ./ M ;
mbe2 = sum(T_sim2' - T_test ) ./ N ;

disp(['训练集数据的MBE为：', num2str(mbe1)])
disp(['测试集数据的MBE为：', num2str(mbe2)])

%%  绘制散点图
sz = 25;
c = 'b';

figure
scatter(T_train, T_sim1, sz, c)
hold on
plot(xlim, ylim, '--k')
xlabel('训练集真实值');
ylabel('训练集预测值');
xlim([min(T_train) max(T_train)])
ylim([min(T_sim1) max(T_sim1)])
title('训练集预测值 vs. 训练集真实值')

figure
scatter(T_test, T_sim2, sz, c)
hold on
plot(xlim, ylim, '--k')
xlabel('测试集真实值');
ylabel('测试集预测值');
xlim([min(T_test) max(T_test)])
ylim([min(T_sim2) max(T_sim2)])
title('测试集预测值 vs. 测试集真实值')