回归分析
回归分析: 寻找两个或多个变量之间的函数关系(相关关系)
一元和线性
- 误差项是一个期望值为0的随机变量,即, 对于一个给定的值, 的期望值为
- 对于所有的值, 的方差都相同
- 误差项是一个服从正态分布的随机变量,且相互独立
回归显著性校验:
- 总离差平方和(SST):
- 残差平方和(SSE):
- 回归平方和(SSR):
相关系数
- 越接近于1,相关性越强
检验
- 提出假设: 线性关系不显著
- 计算检验统计量
- 确定显著性水平,并根据分子自由度1和分母自由度(n-2)找出临界值作出决策: 若, 拒绝假设; 否则接受假设。(概率论与数理统计)
- 越大线性关系越显著
与的关系
- 说明检验和相关系数的一致性
例题
重复测量的分析
对于同一个重复测量得到的值
- 离差平方和:
- 残差平方和:
- 回归平方和:
- 误差平方和:
- 失拟平方和:
两个变量都有误差的一元线性回归
- 衡量了误差偏向的方向
- 问题: 如何通过先验信息测出?
一元非线性
- 化非线性为线性问题的求解
典型的化解方法
具体步骤
- 根据散点图确认非线性回归方程模式
- 把非线性回归方程转换为线性回归方程
- 依据线性回归方程进行求解
- 再转换为非线性回归方程
- 观察数据是否符合某个曲线, 若符合则可以套用公式试试效果
- 以下是常见的曲线
- 在实际情况下,可能有多条曲线符合。这时需要将所有曲线都尝试一遍,然后做显著性校验,选取显著性校验最好的曲线作为结果。
多元线性
矩阵形式:
另一种方法
- 要求的系数比上一种方法少一个,矩阵维数由
- 计算量减少
检验
实例