0. 前言

介绍数据处理技巧部分,本文主要介绍几种分析方法。

 

1. 分析方法

(1)描述统计

该方法可以给出某个数据的基本指标,如:平均值、中位数、众数、方差、标准差、标准误差、峰度、偏度、区域、最小值、最大值、求和、观测数、最大(k)、最小(k)。

指标

介绍

平均

-

标准误差

standard error,标准误。样本统计量的标准差,是衡量样本抽样误差的指标。如果知道总体的标准差,该值=总体的标准差/sqrt(n);

如果知道样本的标准差,该值=样本的标准差/sqrt(n-1). 标准误和标准差的区别详见

standard deviation 和standard error的区别,能讲的通俗些吗? - Shinku的回答 - 知乎 https://www.zhihu.com/question/21925923/answer/286822186

中位数

-

众数

-

标准差

standard deviation,表示一组数值之间的离散程度。

方差

-

峰度

峰度的取值范围为[1,+∞),完全服从正态分布的数据的峰度值为 3,峰度值越大,概率分布图越高尖,峰度值越小,越矮胖。

偏度

偏度的取值范围为(-∞,+∞)

当偏度<0时,概率分布图左偏。

当偏度=0时,表示数据相对均匀的分布在平均值两侧,不一定是绝对的对称分布。

当偏度>0时,概率分布图右偏。

区域

极差 = 最大值 - 最小值

最小值

-

最大值

-

求和

-

观测数

数据量

最大(k)

第K大的数

最小(k)

第K小的数

置信度(95.0%)

指的是在95%的置信度下计算出的平均值的允许误差,可以用平均值+或-这个数来计算置信区间的上限和下限.

(2)协方差

该方法提供按行或者列计算协方差矩阵,对角线上的为方差。

什么样的数据用mongodb 什么样的数据用逐差法_excel

 

(3)相关系数

该方法提供按行或者列计算相关系数。

什么样的数据用mongodb 什么样的数据用逐差法_方差分析_02

 

(4)回归

对于Excel给出的分析报告的解读

https://wenku.baidu.com/view/0996a441866fb84ae55c8d3c.html

 

(5)F-检验 双样本方差

该方法是验证两个总体方差是否相等的假设检验,也称为方差齐性检验。如何利用Excel做F检验-双样本方差分析?

 

(6)Z-检验:双样本平均差检验

独立随机样本取自均值未知,标准差已知的两个正态分布总体,根据样本判断总体均值是否相等或者等于某个常数。

https://zhuanlan.zhihu.com/p/49590022

 

(7)方差分析

方差分析:单因素方差分析 单因素方差分析及Excel示例

方差分析:可重复双因素分析 excel双因素方差分析(可重复)

方差分析:无重复双因素分析 双因素无重复试验方差分析

 

(8)t-检验

T-检验:平均值的成对二样本分析

T-检验:双样本等方差假设

T-检验:双样本异方差假设

https://www.jianshu.com/p/1c60c9c3fe33

 

2. 实践操作