数据线性回归与分类分析

  • 一、高尔顿数据集(一元)线性回归分析
  • 二、 Anscombe四重奏(一元)线性回归分析


一、高尔顿数据集(一元)线性回归分析

  1. 下载高尔顿数据集excel文件
  2. 分类模型改回归模型 分类数据做回归分析_数据集

  3. 数据分析>>回归
  4. 分类模型改回归模型 分类数据做回归分析_线性回归_02


  5. 分类模型改回归模型 分类数据做回归分析_数据集_03

  6. 选择Y/X输入区域(这里Y为孩子身高,X为父亲身高),其他的勾上对应你想要的数据
  7. 分类模型改回归模型 分类数据做回归分析_线性回归_04

  8. 出现结果(我这里已经调整好线性回归图)
  9. 分类模型改回归模型 分类数据做回归分析_数据_05

  10. 调整回归图,双击红框部分,可以调整名称与X/Y轴数据
  11. 分类模型改回归模型 分类数据做回归分析_数据_06


  12. 分类模型改回归模型 分类数据做回归分析_数据集_07

  13. 右键蓝色区域(蓝色点为实际数据,橙色为预测线性回归数据),选择添加趋势线,然后选择线性并相应勾上公式与R平方值,会出现下图
  14. 分类模型改回归模型 分类数据做回归分析_分类模型改回归模型_08

分类模型改回归模型 分类数据做回归分析_线性回归_09


分类模型改回归模型 分类数据做回归分析_数据_10

  1. 母子与父子的线性回归图一样,如下
  2. 由下图,他们的P值都远小于0.001,所以回归方程都成立
  3. 若新家庭父亲身高75英寸,儿子身高应为0.4477*75+38.259≈71.8英寸
  4. 下面是二元线性回归图,由第三参数表可以看出来二元回归方程为y=0.41175x1+0.33355x2+19.39988

二、 Anscombe四重奏(一元)线性回归分析

  1. 数据分析步骤同上,直接放结果

分类模型改回归模型 分类数据做回归分析_数据集_11

图1


分类模型改回归模型 分类数据做回归分析_数据_12

图2


分类模型改回归模型 分类数据做回归分析_分类模型改回归模型_13

图3


分类模型改回归模型 分类数据做回归分析_数据集_14

图4


  1. 由上面四个图,四组数据描绘在图表中,是四种完全不同的情况。第一组数据是貌似最“正常”的一组数据;第二组数据所反映的事实上是一个精确的二次函数关系,只是在错误地应用了线性模型后,各项统计数字与第一组数据恰好都相同;第三组数据描述的是一个精确的线性关系,只是这里面有一个异常值,它导致了上述各个统计数字,尤其是相关度值的偏差;第四组数据则是一个更极端的例子,其异常值导致了平均数、方差、相关度、线性回归线等所有统计数字全部发生偏差。
    再看他们的P值,都大于0.05,偏差很大。
    所以四个回归方程都不成立。