总是会看到有人在问:“毕业论文,P值大于0.05怎么办!!急!”或者是“SPSS出现乱码了怎么解决?”又如“为什么分析出来两个变量有回归影响关系,但是却没有相关关系,怎么解释?”这些问题总是反反复复被提及,这时候就会想,SPSSAU中已经搭配了帮助手册也有很多常见问题的处理说明,但真正遇到问题时,大家还是慌不择路,不知道怎么解决。

python 协整检验检验因变量 协整检验p值大于0.05_大数据

所以我们在这里按照问题类型,分类整理出几类在数据分析中常见的问题,并加以解答,希望能帮助大家快速找到解决问题的方法,在第一时间消灭问题。

python 协整检验检验因变量 协整检验p值大于0.05_机器学习_02

1) 分析结果显示P值为0.05或者0.01时如何处理?

P值是统计分析核心概念,理论上P值是指拒绝原假设时,统计犯错的概率。其常见标准为0.05和0.01,如果此值小于0.01,则说明在0.01水平显著,如果此值小于0.05(但大于0.01)则说明在0.05水平显著。如果P值刚好为0.05,则结论为不显著(以0.05为标准时),实际研究中刚好为0.05的可能性非常小,很可能是由于小数位保留问题所致,建议可以将保留更多小数位。

2) 绝大部分P值高于0.05,个别P值小于0.1,如何处理?

多数情况下,P值以0.01和0.05作为判断,如果研究时发现P值均高于0.05,但是个别小于0.1,建议可以考虑以0.1作为判断,以便研究出现显著性结果。

3) P值小于0.05才算良好?

绝大多数情况下,P值小于0.05是研究希望的结果。但有两个地方P值需要高于0.05,分别是方差齐性检验和二元Logistic回归时的Hosmer and Lemeshow检验。另外,P值高于0.05,则说明不显著,没有差异性,或者没有相关影响关系等,也许这也是有意义的结论。

4)缺失值如何处理?

问卷研究中缺失值较为常见,如果样本较多,可以直接将缺失样本处理为无效样本,如果样本较少,并且缺失值并不多,此时可以不用处理。如果缺失值较多并且不能删除样本,可以取中位数或者平均值补替缺失数据。

5) 累积百分比是什么?

累积百分比是指多个选项百分比的累积,比如收入1000以下的比例是10%,1000~2000的样本比例是20%,则此两个选项的百分比累积为30%。

6)多个量表题表示一个维度,如何将多个题概括成一个题?

针对问卷量表数据,同时几个题表示一个维度。

比如有两个题“我愿意向朋友推荐SPSSAU”,“我有需要会再来使用SPSSAU”,此两个题是“忠诚度”的体现。但现在需要“忠诚度”这个整体,而不是具体两个标题,此时如何办呢?

解决办法

使用“生成变量”的平均值功能即可。使用Ctrl或者Shift键,选中连续或不连续多个标题,确认后,SPSSAU会默认生成一个新的标题。如下图所示:

python 协整检验检验因变量 协整检验p值大于0.05_人工智能_03

通常将多个题概括成一个题之后,则可以进行相关分析、回归分析、方差分析等(以整体进行,而不需要以题项分别进行)


更多干货请前往SPSSAU官网查看。