MATLAB 线性回归多项式拟合+预测区间、置信区间的绘制

  • 一、前言
  • 二、多项式拟合polyfit
  • 1、语法
  • 2、示例
  • 三、区间绘制
  • 四、整体源码
  • 五、思考
  • 六、参考博客


一、前言

现有一组数据:x、y

x=[1 2 3 4 5 6 7 8 9 10];
y=[11 13 15 14 17 14 18 16 19 20];

对该数据进行线性回归(1次多项式拟合)并且绘制预测区间和置信度为95%的置信区间

拟合参数:

python岭回归做置信区间 回归参数的置信区间_python岭回归做置信区间


拟合绘制:

python岭回归做置信区间 回归参数的置信区间_数据分析_02

二、多项式拟合polyfit

1、语法

p=polyfit(x,y,n):最小二乘法计算拟合多项式系数。x,y为拟合数据向量,要求维度相同,n为拟合多项式次数。返回p向量保存多项式系数,由最高次向最低次排列。

 y=polyval(p,x):计算多项式的函数值。返回在x处多项式的值,p为多项式系数,元素按多项式降幂排序。

具体语法可参考 :【help-plyfit】

2、示例

x=[1 2 3 4 5 6 7 8 9 10];
y=[11 13 15 14 17 14 18 16 19 20];
a1=x;
a2=y;
[p,s]=polyfit(a1,a2,1);
fprintf("拟合系数分别为:%f %f\n",p(1),p(2));
y1= polyval(p,x);

三、区间绘制

这里提到:

  • 置信区间估计(confidence interval estimate):
    利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的估计区间。
  • 预测区间估计(prediction interval estimate):
    利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间。

代码如下:

% 95% prediction interval 计算:
[yfit,dy1] = polyconf(p,x,s);
% 95% confidence interval 计算:
[yfit,dy] = polyconf(p,a1,s,'predopt','curve');
hold on
%置信区域绘制
% fill([a1,fliplr(a1)],[yfit-dy,fliplr(yfit+dy)],[255/255 204/255 255/255],'EdgeColor','none');
% fill([a1,fliplr(a1)],[yfit-dy1,fliplr(yfit+dy1)],[255/255 204/255 255/255],'EdgeColor','none');
plot(a1,y1+dy,'r--',a1,y1-dy,'r--',a1,y1+dy1,'y--',a1,y1-dy1,'y--','LineWidth',1.5)

四、整体源码

%线性回归+置信区
%置信区间估计(confidence interval estimate):利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值的估计区间。
%预测区间估计(prediction interval estimate):利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的一个个别值的估计区间。
clc;
clear;
%导入数据
x=[1 2 3 4 5 6 7 8 9 10];
y=[11 13 15 14 17 14 18 16 19 20];
% 数据排序,根据第一行的排列顺序进行整体排序
a=[x;y];
a1=a(1,:);
[a1,pos]=sort(a1);%左侧的a1是排列之后的第一行,pos是排序后的下标
a2=a(2,pos);      %a2,是排列好的第二行
% 多项式拟合
[p,s]=polyfit(a1,a2,1);
fprintf("拟合系数分别为:%f %f\n",p(1),p(2));
y1= polyval(p,a1);
% 95% prediction interval 计算:
[yfit,dy1] = polyconf(p,x,s);
% 95% confidence interval 计算:
[yfit,dy] = polyconf(p,a1,s,'predopt','curve');
hold on
%置信区域绘制
% fill([a1,fliplr(a1)],[yfit-dy,fliplr(yfit+dy)],[255/255 204/255 255/255],'EdgeColor','none');
% fill([a1,fliplr(a1)],[yfit-dy1,fliplr(yfit+dy1)],[255/255 204/255 255/255],'EdgeColor','none');
plot(a1,y1+dy,'r--',a1,y1-dy,'r--',a1,y1+dy1,'y--',a1,y1-dy1,'y--','LineWidth',1.5)
hold on 
plot(a1,y1,'k','linewidth',1.5)
hold on;
scatter(x(1,1:10),y(1:10),'k','fill');
%R2
r2 = 1 - (sum((y1 - a2).^2) / sum((a2 - mean(a2)).^2))

五、思考

  • 我在代码中增添了a1、a2,它们的作用是保证x、y数据的顺序性,对x进行排序,对应的y跟着x的排序进行变动。这样可以保证使用fill函数时能够得到我们想要的效果(填充满区域)。