一、引言

本文以一元线性回归为例,整理线性回归模型参数的估计方法。

样本sas 一元二次回归 一元二次回归方程拟合_ide可由sas 一元二次回归 一元二次回归方程拟合_最小值_02 表示,其中,sas 一元二次回归 一元二次回归方程拟合_最小值_03为随机因素引起的噪声, sas 一元二次回归 一元二次回归方程拟合_线性回归_04为用变量sas 一元二次回归 一元二次回归方程拟合_sas 一元二次回归_05sas 一元二次回归 一元二次回归方程拟合_最小值_06关系描述的一元线性回归模型。模型中参数sas 一元二次回归 一元二次回归方程拟合_sas 一元二次回归_07sas 一元二次回归 一元二次回归方程拟合_ide_08估计的两种常用方法为最小二程法、最大似然估计法。

二、假设条件

(1)样本观测值sas 一元二次回归 一元二次回归方程拟合_线性回归_09数据是独立观测的;
(2)解释变量sas 一元二次回归 一元二次回归方程拟合_sas 一元二次回归_05是确定性变量,并非随机变量;
(3)随机变量sas 一元二次回归 一元二次回归方程拟合_数据分析_11的期望不等,但方差相等,即sas 一元二次回归 一元二次回归方程拟合_数据分析_11独立但不同分布;
(4)随机变量残差(扰动项)sas 一元二次回归 一元二次回归方程拟合_线性回归_13独立同分布,且sas 一元二次回归 一元二次回归方程拟合_最小值_14,则sas 一元二次回归 一元二次回归方程拟合_sas 一元二次回归_15

三、最小二乘法

最小二程法用来寻找线性回归模型中的参数sas 一元二次回归 一元二次回归方程拟合_sas 一元二次回归_07sas 一元二次回归 一元二次回归方程拟合_ide_08的估计值,估计值用sas 一元二次回归 一元二次回归方程拟合_ide_18sas 一元二次回归 一元二次回归方程拟合_ide_19表示。为获得最优估计值,算法将预测值和真实观测值之间的误差最小作为优化目标,即计算扰动项的最小值:
sas 一元二次回归 一元二次回归方程拟合_线性回归_20
于是sas 一元二次回归 一元二次回归方程拟合_sas 一元二次回归_07sas 一元二次回归 一元二次回归方程拟合_ide_08的参数估计变成求sas 一元二次回归 一元二次回归方程拟合_最小值_23的极值问题,求偏导
sas 一元二次回归 一元二次回归方程拟合_最小值_24
即可得到极值条件下的参数值,即为估计值sas 一元二次回归 一元二次回归方程拟合_ide_18sas 一元二次回归 一元二次回归方程拟合_ide_19。整理后得结果:
sas 一元二次回归 一元二次回归方程拟合_线性回归_27

四、极大似然估计

最小二乘法从扰动项sas 一元二次回归 一元二次回归方程拟合_最小值_03的最小值入手,而极大似然估计从扰动项sas 一元二次回归 一元二次回归方程拟合_最小值_03的概率分布入手。
最大似然估计的思想是利用总体的分布密度(连续变量)或概率分布(离散变量)的表达式、以及样本提供的信息建立求解未知参数估计量的方法。这种方法将能够使用的样本视为从总体中被抽中的概率最大的样本,所以这些样本的联合分布密度或联合概率分布为最大值时,模型的估计值最准确。
对于线性回归,假设sas 一元二次回归 一元二次回归方程拟合_最小值_03服从均值为0、方差为sas 一元二次回归 一元二次回归方程拟合_线性回归_31正态分布,sas 一元二次回归 一元二次回归方程拟合_线性回归_32是与sas 一元二次回归 一元二次回归方程拟合_数据分析_33相关的非随机样本,则sas 一元二次回归 一元二次回归方程拟合_线性回归_34sas 一元二次回归 一元二次回归方程拟合_数据分析_33的分布密度函数为:
sas 一元二次回归 一元二次回归方程拟合_数据分析_36
样本sas 一元二次回归 一元二次回归方程拟合_数据分析_11的联合密度分布函数为:
sas 一元二次回归 一元二次回归方程拟合_线性回归_38
取对数后:
sas 一元二次回归 一元二次回归方程拟合_ide_39
等价于求sas 一元二次回归 一元二次回归方程拟合_sas 一元二次回归_40的极小值,回到最小二乘法的原理。整理后得结果:
sas 一元二次回归 一元二次回归方程拟合_线性回归_27
参考书:《应用回归分析》何晓群