python岭回归做置信区间回归参数的置信区间

转载

互联网小墨风 2023-12-19 15:47:01

文章标签 python岭回归做置信区间 matlab 数据分析置信度拟合 文章分类 Python 后端开发

MATLAB 线性回归多项式拟合+预测区间、置信区间的绘制

一、前言
二、多项式拟合polyfit

1、语法
2、示例

三、区间绘制
四、整体源码
五、思考
六、参考博客

一、前言

现有一组数据：x、y

x=[1 2 3 4 5 6 7 8 9 10];
y=[11 13 15 14 17 14 18 16 19 20];

对该数据进行线性回归（1次多项式拟合）并且绘制预测区间和置信度为95%的置信区间

拟合参数:

python岭回归做置信区间回归参数的置信区间_python岭回归做置信区间

拟合绘制：

python岭回归做置信区间回归参数的置信区间_数据分析_02

二、多项式拟合polyfit

1、语法

p=polyfit(x,y,n)：最小二乘法计算拟合多项式系数。x，y为拟合数据向量，要求维度相同，n为拟合多项式次数。返回p向量保存多项式系数，由最高次向最低次排列。

 y=polyval(p,x)：计算多项式的函数值。返回在x处多项式的值，p为多项式系数，元素按多项式降幂排序。

具体语法可参考：【help-plyfit】

2、示例

x=[1 2 3 4 5 6 7 8 9 10];
y=[11 13 15 14 17 14 18 16 19 20];
a1=x;
a2=y;
[p,s]=polyfit(a1,a2,1);
fprintf("拟合系数分别为：%f %f\n",p(1),p(2));
y1= polyval(p,x);

三、区间绘制

这里提到：

置信区间估计(confidence interval estimate)：
利用估计的回归方程，对于自变量 x 的一个给定值 x0 ，求出因变量 y 的平均值的估计区间。
预测区间估计(prediction interval estimate)：
利用估计的回归方程，对于自变量 x 的一个给定值 x0 ，求出因变量 y 的一个个别值的估计区间。

代码如下：

% 95% prediction interval 计算：
[yfit,dy1] = polyconf(p,x,s);
% 95% confidence interval 计算：
[yfit,dy] = polyconf(p,a1,s,'predopt','curve');
hold on
%置信区域绘制
% fill([a1,fliplr(a1)],[yfit-dy,fliplr(yfit+dy)],[255/255 204/255 255/255],'EdgeColor','none');
% fill([a1,fliplr(a1)],[yfit-dy1,fliplr(yfit+dy1)],[255/255 204/255 255/255],'EdgeColor','none');
plot(a1,y1+dy,'r--',a1,y1-dy,'r--',a1,y1+dy1,'y--',a1,y1-dy1,'y--','LineWidth',1.5)

四、整体源码

%线性回归+置信区
%置信区间估计(confidence interval estimate)：利用估计的回归方程，对于自变量 x 的一个给定值 x0 ，求出因变量 y 的平均值的估计区间。
%预测区间估计(prediction interval estimate)：利用估计的回归方程，对于自变量 x 的一个给定值 x0 ，求出因变量 y 的一个个别值的估计区间。
clc;
clear;
%导入数据
x=[1 2 3 4 5 6 7 8 9 10];
y=[11 13 15 14 17 14 18 16 19 20];
% 数据排序，根据第一行的排列顺序进行整体排序
a=[x;y];
a1=a(1,:);
[a1,pos]=sort(a1);%左侧的a1是排列之后的第一行，pos是排序后的下标
a2=a(2,pos);      %a2,是排列好的第二行
% 多项式拟合
[p,s]=polyfit(a1,a2,1);
fprintf("拟合系数分别为：%f %f\n",p(1),p(2));
y1= polyval(p,a1);
% 95% prediction interval 计算：
[yfit,dy1] = polyconf(p,x,s);
% 95% confidence interval 计算：
[yfit,dy] = polyconf(p,a1,s,'predopt','curve');
hold on
%置信区域绘制
% fill([a1,fliplr(a1)],[yfit-dy,fliplr(yfit+dy)],[255/255 204/255 255/255],'EdgeColor','none');
% fill([a1,fliplr(a1)],[yfit-dy1,fliplr(yfit+dy1)],[255/255 204/255 255/255],'EdgeColor','none');
plot(a1,y1+dy,'r--',a1,y1-dy,'r--',a1,y1+dy1,'y--',a1,y1-dy1,'y--','LineWidth',1.5)
hold on 
plot(a1,y1,'k','linewidth',1.5)
hold on;
scatter(x(1,1:10),y(1:10),'k','fill');
%R2
r2 = 1 - (sum((y1 - a2).^2) / sum((a2 - mean(a2)).^2))