分类数据分析是针对类别型变量之间是否有影响进行的分析。而相关分析是类别型变量之间有影响的前提下,研究变量间相关的程度,以及正相关还是负相关。方差分析稍有不同,是研究分类型变量对数值型变量的影响(而不是类别型变量之间的关系)。
上统计学课的时候这几个部分都是我比较喜欢的,柳老师讲的非常有趣。

三种分析的分析思路

(一)、分类型变量的处理思路

分类数据分析课程 分类数据分析报告_方差分析


(二)、类别变量与数值型变量的关系或者数值变量之间关系的研究处理思路

分类数据分析课程 分类数据分析报告_相关分析_02


ps:这里我还存在着一个疑惑,总体两个变量检验结果为显著时,ρ!=0,则不是意味着样本的r不符合正态分布的假定吗?如果不符合正态性分布假定就无法用样本r估计总体ρ,感觉这样计算r还有什么意义呢(毕竟不能用来代表总体了)。尽管不符合正态分布性假定,但还是可以通过一定变换构造r分布模型。感觉前面几句的推理怪怪的但是不知道错在哪里,希望大家多多指正!~

如何判别是否符合正态分布假定如下:利用spss正态分布假定检验 S-W检验 K-S检验 直方图 Q-Q图(三)、方差分析与相关分析的异同比较分析

  1. 相关分析:相关分析着重于分析两个及以上的随机变量的相关关系,但也可以用于分析数值型+分类型变量(哑变量回归),对变量的类型要求不高;主要通过相关系数或者相关系数矩阵去衡量变量间相关关系。
  2. 回归分析:回归分析主要研究随机变量之间的依赖关系(当一个变量变化时另一个变量是否有协同变化以及协同变化的程度)通过一个变量去预测另一个变量,可以达到预测的目的。
  3. 方差分析:方差分析用于两个及两个以上的样本均数差别的显著性检验,检验两组或多组数据的均值是否具有显著性差异,如果是存在显著性差异则代表一组数据的变化会引起另一组数据的变化,而不是由于随机误差引起的。

如果想要研究一组数据的变化是否影响另一组,可以用相关分析来检验,若相关关系较强则会影响,反之,则不会影响。若想要分析一组数据的变化如何影响另一组,此时,则需要进行回归分析,如回归系数大于0,则因变量和自变量成正相关关系,如回归系数小于0,则因变量和自变量成负相关关系。如果要分析“一组数据的变化可以用另一组数据的变化来解释的程度”则使用方差分析。