卡方分布 是概率论与统计学中常用的一种概率分布,k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布

简介

卡方分布(英语:chi-square distribution, χ²-distribution,或写作χ²分布)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。

由卡方分布延伸出来皮尔逊卡方检验常用于:

  1. 样本某性质的比例分布与总体理论分布的拟合优度(例如某行政机关男女比是否符合该机关所在城镇的男女比);
  2. 同一总体的两个随机变量是否独立(例如人的身高与交通违规的关联性);
  3. 二或多个总体同一属性的同素性检验(意大利面店和寿司店的营业额有没有差距)。

定义

若n个互相独立的随机变量卡方分布_概率分布均服从标准正态分布卡方分布_正态分布_02,则这n个独立随机变量的平方和公式卡方分布_正态分布_03

这n个独立随机变量的平方和构成一个新的随机变量,服从自由度为n的卡方分布_正态分布_04的分布,即卡方分布,记为卡方分布_概率分布_05~卡方分布_正态分布_06

卡方分布的概率密度函数为:

卡方分布_正态分布_07

其中卡方分布_概率密度函数_08

性质

概率密度函数

卡方分布_正态分布_09

性质参数

参数

描述

自由度

卡方分布_概率密度函数_10

值域

卡方分布_概率密度函数_11

概率密度函数

卡方分布_概率密度函数_12

累计分布函数

卡方分布_概率分布_13

期望

卡方分布_正态分布_14

中位数

卡方分布_正态分布_15

众数

卡方分布_正态分布_16

方差

卡方分布_概率密度函数_17

偏度

卡方分布_概率密度函数_18

峰度

卡方分布_正态分布_19

卡方分布_概率密度函数_20



矩生成函数





卡方分布_概率密度函数_21



特征函数

卡方分布_概率分布_22

可加性

由定义可得,独立卡方变量之和同样服从卡方分布。特别地,若 卡方分布_正态分布_23 分别独立服从自由度为 卡方分布_概率密度函数_24 的卡方分布,那么它们的和 卡方分布_概率密度函数_25 服从自由度为卡方分布_概率密度函数_26


卡方分布表

χ2越大,p-value越小,则可信度越高。通常用p=0.05作为阈值,即95%的可信度。

自由度k \ P value (概率)

0.95

0.90

0.80

0.70

0.50

0.30

0.20

0.10

0.05

0.01

0.001

1

0.004

0.02

0.06

0.15

0.46

1.07

1.64

2.71

3.84

6.64

10.83

2

0.10

0.21

0.45

0.71

1.39

2.41

3.22

4.60

5.99

9.21

13.82

3

0.35

0.58

1.01

1.42

2.37

3.66

4.64

6.25

7.82

11.34

16.27

4

0.71

1.06

1.65

2.20

3.36

4.88

5.99

7.78

9.49

13.28

18.47

5

1.14

1.61

2.34

3.00

4.35

6.06

7.29

9.24

11.07

15.09

20.52

6

1.63

2.20

3.07

3.83

5.35

7.23

8.56

10.64

12.59

16.81

22.46

7

2.17

2.83

3.82

4.67

6.35

8.38

9.80

12.02

14.07

18.48

24.32

8

2. 73

3.49

4.59

5.53

7.34

9.52

11.03

13.36

15.51

20.09

26.12

9

3.32

4.17

5.38

6.39

8.34

10.66

12.24

14.68

16.92

21.67

27.88

10

3.94

4.86

6.18

7.27

9.34

11.78

13.44

15.99

18.31

23.21

29.59