本博文源于《商务统计》,多重共线性是描述多元线性回归中的变量间出现了相关性。如果在多元线性回归中没有考虑多重共线性,就会导致很多不好的后果,因此本博文旨在讲述多重共线性的识别。

多重共线性的后果

了解了后果会让我们在识别中可以根据结果逆推出多元线性回归是否真的出现了多重共线性。

  • 可能会使回归的结果造成混论,甚至会将分析引入歧途。
  • 可能对参数估计值的正负号产生影响,特别是各回归系数的正负号有可能同我们预期的正负号相反。
  • 变量的显著性检验失去了意义。因为存在多重共线性,参数估计值的方差与标准差变大,容易使通过样本计算的t值小于临界值,误导作出参数为0的推断。

多重共线性的识别

  • 检验各对自变量之间的相关系数,若有一个或多个相关系数显著,就表示模型中所用的自变量之间相关,存在着多重共线性。
  • 回归系数的正负号与预期的相反。
  • 模型中各对自变量之间显著相关暗示可能多重共线性。

总结

多重共线性告诉我们,当变量高度相关时,我们可以考虑主成分分析和岭回归之类的分析方法。变量高度相关就是根据显著性检验来观测。