在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。

在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个。这样的模型被称为多元线性回归模型。

多元线性回归模型的一般表现形式为

Yi=β0+β1X1i+β2X2i+…+βkXki+μi i=1,2,…,n

其中 k为解释变量的数目,βj(j=1,2,…,k)称为 回归系数(regression coefficient)。上式也被称为 总体回归函数的随机表达式。它的非随机表达式为

E(Y∣X1i,X2i,…Xki,)=β0+β1X1i+β2X2i+…+βkXki

βj也被称为 偏回归系数。

1.Matlab多元线性回归模型实现

(1) b=regress( Y,    X ) 确定回归系数的点估计值

其中, Y 为 n*1 的矩阵; X 为( ones(n,1),x1,…,xm )的矩阵;

(2)[b, bint,r,rint,stats]=regress(Y,X,alpha) 求回归系数的点估计和区间估计,并检验回归模型

  • b 回归系数
  • bint 回归系数的区间估计
  • r 残差
  • rint 残差置信区间
  • stats 用于检验回归模型的统计量,有四个数值:相关系数R2、F值、与F对应的概率p,误差方差。相关系数R2越接近1,说明回归方程越显著;F > F1-α(k,n-k-1)时拒绝H0,F越大,说明回归方程越显著;与F对应的概率p 时拒绝H0,回归模型成立。p值在0.01-0.05之间,越小越好。

(3) 出残差以及其置信区间 : rcoplot(r,rint);

实例1:(一元线性回归)

测得16名女子的身高和腿长如下表所示(单位:cm)

多元回归模型的标准误 多元回归模型yi=β1+β2_matlab

试研究这些数据之间的关系。

Matlab程序为:(输入如下命令)

多元回归模型的标准误 多元回归模型yi=β1+β2_线性回归_02

结果显示:

多元回归模型的标准误 多元回归模型yi=β1+β2_多元回归模型的标准误_03

因此我们可得y=-16.0730+0.7194x 成立

(残差分析)

接着输入

多元回归模型的标准误 多元回归模型yi=β1+β2_matlab_04

结果显示

多元回归模型的标准误 多元回归模型yi=β1+β2_一元线性回归_05

(预测及作图)

接着输入

多元回归模型的标准误 多元回归模型yi=β1+β2_matlab_06

结果显示

多元回归模型的标准误 多元回归模型yi=β1+β2_一元线性回归_07

实例2:(多元线性回归)

水泥凝固时放出的热量y与水泥中的四种化学成分x1,x2,x3,x4有关,今测得一组数据如下,试确定多元线性模型。

多元回归模型的标准误 多元回归模型yi=β1+β2_线性回归_08

Matlab程序:(输入命令)

多元回归模型的标准误 多元回归模型yi=β1+β2_多元线性回归_09

结果显示

多元回归模型的标准误 多元回归模型yi=β1+β2_matlab_10

因此,我们得到y=-62.4045+1.55x1+0.5102x2+0.1019x3-0.1441x4成立

(残差分析)

接着输入

多元回归模型的标准误 多元回归模型yi=β1+β2_一元线性回归_11

结果显示

多元回归模型的标准误 多元回归模型yi=β1+β2_线性回归_12

接着输入

多元回归模型的标准误 多元回归模型yi=β1+β2_多元回归模型的标准误_13

预测结果

多元回归模型的标准误 多元回归模型yi=β1+β2_线性回归_14

4.错误:Warning: R-square and the F statistic are not well-defined unless X has a column of ones.

Type "help regress" for more information.

没有常数项的意思!