机器学习奠基---概率论基础知识_互斥

概率论和数理统计

随机事件和概率

1.事件的关系与运算

(1) 子事件:机器学习奠基---概率论基础知识_互斥_02,若机器学习奠基---概率论基础知识_互斥_03发生,则机器学习奠基---概率论基础知识_概率分布_04发生。 Notes:机器学习奠基---概率论基础知识_互斥_03机器学习奠基---概率论基础知识_概率分布_04的子事件,机器学习奠基---概率论基础知识_概率论_07

(2) 相等事件:机器学习奠基---概率论基础知识_概率论_08,即机器学习奠基---概率论基础知识_互斥_02,且机器学习奠基---概率论基础知识_机器学习基础_10

(3) 和事件:机器学习奠基---概率论基础知识_互斥_11(或机器学习奠基---概率论基础知识_二维_12),机器学习奠基---概率论基础知识_互斥_03机器学习奠基---概率论基础知识_概率分布_04中至少有一个发生。 推广:若机器学习奠基---概率论基础知识_概率论_15是互不相容的事件序列,则机器学习奠基---概率论基础知识_概率论_16

(4) 差事件:机器学习奠基---概率论基础知识_概率分布_17机器学习奠基---概率论基础知识_互斥_03发生但机器学习奠基---概率论基础知识_概率分布_04不发生。

(5) 积事件:机器学习奠基---概率论基础知识_机器学习基础_20(或机器学习奠基---概率论基础知识_概率分布_21),机器学习奠基---概率论基础知识_互斥_03机器学习奠基---概率论基础知识_概率分布_04同时发生。

(6) 互斥事件(互不相容):机器学习奠基---概率论基础知识_机器学习基础_20=机器学习奠基---概率论基础知识_概率论_25

(7) 互逆事件(对立事件):机器学习奠基---概率论基础知识_概率论_26

(8)机器学习奠基---概率论基础知识_概率论_27
2.运算律
(1) 交换律:机器学习奠基---概率论基础知识_概率分布_28
(2) 结合律:机器学习奠基---概率论基础知识_二维_29
(3) 分配律:机器学习奠基---概率论基础知识_机器学习基础_30
3.德机器学习奠基---概率论基础知识_二维_31摩根律

机器学习奠基---概率论基础知识_概率分布_32 机器学习奠基---概率论基础知识_互斥_33
4.完全事件组

机器学习奠基---概率论基础知识_二维_34两两互斥,且和事件为必然事件,即机器学习奠基---概率论基础知识_互斥_35
5.概率的基本公式
(1)条件概率:
机器学习奠基---概率论基础知识_互斥_36,表示机器学习奠基---概率论基础知识_互斥_03发生的条件下,机器学习奠基---概率论基础知识_概率分布_04发生的概率。
(2)全概率公式:
机器学习奠基---概率论基础知识_互斥_39 如何推出? 条件概率变形,机器学习奠基---概率论基础知识_二维_40
(3) Bayes公式:
机器学习奠基---概率论基础知识_机器学习基础_41
注:上述公式中事件机器学习奠基---概率论基础知识_机器学习基础_42的个数可为可列个。
(4)乘法公式:
机器学习奠基---概率论基础知识_互斥_43
机器学习奠基---概率论基础知识_概率分布_44
6.事件的独立性
(1)机器学习奠基---概率论基础知识_互斥_03机器学习奠基---概率论基础知识_概率分布_04相互独立机器学习奠基---概率论基础知识_机器学习基础_47
(2)机器学习奠基---概率论基础知识_互斥_03机器学习奠基---概率论基础知识_概率分布_04机器学习奠基---概率论基础知识_概率论_50两两独立
机器学习奠基---概率论基础知识_机器学习基础_47;机器学习奠基---概率论基础知识_概率分布_52 ;机器学习奠基---概率论基础知识_概率分布_53;
(3)机器学习奠基---概率论基础知识_互斥_03机器学习奠基---概率论基础知识_概率分布_04机器学习奠基---概率论基础知识_概率论_50相互独立
机器学习奠基---概率论基础知识_机器学习基础_47; 机器学习奠基---概率论基础知识_概率分布_52 ;
机器学习奠基---概率论基础知识_概率分布_53 ; 机器学习奠基---概率论基础知识_概率论_60
7.独立重复试验

将某试验独立重复机器学习奠基---概率论基础知识_机器学习基础_61次,若每次实验中事件A发生的概率为机器学习奠基---概率论基础知识_机器学习基础_62,则机器学习奠基---概率论基础知识_机器学习基础_61次试验中机器学习奠基---概率论基础知识_互斥_03发生机器学习奠基---概率论基础知识_概率分布_65次的概率为:
机器学习奠基---概率论基础知识_二维_66
8.重要公式与结论
机器学习奠基---概率论基础知识_概率分布_67
机器学习奠基---概率论基础知识_互斥_68
机器学习奠基---概率论基础知识_概率论_69
机器学习奠基---概率论基础知识_互斥_70
机器学习奠基---概率论基础知识_互斥_71
机器学习奠基---概率论基础知识_互斥_72
(5)条件概率机器学习奠基---概率论基础知识_概率论_73满足概率的所有性质,
例如:. 机器学习奠基---概率论基础知识_机器学习基础_74
机器学习奠基---概率论基础知识_机器学习基础_75
机器学习奠基---概率论基础知识_概率论_76
(6)若机器学习奠基---概率论基础知识_机器学习基础_77相互独立,则机器学习奠基---概率论基础知识_互斥_78
机器学习奠基---概率论基础知识_机器学习基础_79
(7)互斥、互逆与独立性之间的关系:
机器学习奠基---概率论基础知识_互斥_03机器学习奠基---概率论基础知识_概率分布_04互逆机器学习奠基---概率论基础知识_二维_82 机器学习奠基---概率论基础知识_互斥_03机器学习奠基---概率论基础知识_概率分布_04互斥,但反之不成立,机器学习奠基---概率论基础知识_互斥_03机器学习奠基---概率论基础知识_概率分布_04互斥(或互逆)且均非零概率事件$\Rightarrow $机器学习奠基---概率论基础知识_互斥_03机器学习奠基---概率论基础知识_概率分布_04不独立.
(8)若机器学习奠基---概率论基础知识_互斥_89相互独立,则机器学习奠基---概率论基础知识_互斥_90机器学习奠基---概率论基础知识_机器学习基础_91也相互独立,其中机器学习奠基---概率论基础知识_机器学习基础_92分别表示对相应事件做任意事件运算后所得的事件,另外,概率为1(或0)的事件与任何事件相互独立.

随机变量及其概率分布

1.随机变量及概率分布

取值带有随机性的变量,严格地说是定义在样本空间上,取值于实数的函数称为随机变量,概率分布通常指分布函数或分布律

2.分布函数的概念与性质

定义: 机器学习奠基---概率论基础知识_概率分布_93

性质:(1)机器学习奠基---概率论基础知识_二维_94

(2) 机器学习奠基---概率论基础知识_概率分布_95单调不减

(3) 右连续机器学习奠基---概率论基础知识_概率论_96

(4) 机器学习奠基---概率论基础知识_概率分布_97

3.离散型随机变量的概率分布

机器学习奠基---概率论基础知识_概率论_98

4.连续型随机变量的概率密度

概率密度机器学习奠基---概率论基础知识_机器学习基础_99;非负可积,且:

(1)机器学习奠基---概率论基础知识_互斥_100

(2)机器学习奠基---概率论基础知识_二维_101

(3)机器学习奠基---概率论基础知识_互斥_102机器学习奠基---概率论基础知识_机器学习基础_99的连续点,则:

机器学习奠基---概率论基础知识_概率论_104分布函数机器学习奠基---概率论基础知识_概率论_105
5.常见分布

(1) 0-1分布:机器学习奠基---概率论基础知识_机器学习基础_106

(2) 二项分布:机器学习奠基---概率论基础知识_概率分布_107机器学习奠基---概率论基础知识_概率论_108

(3) Poisson分布:机器学习奠基---概率论基础知识_互斥_109机器学习奠基---概率论基础知识_二维_110

(4) 均匀分布机器学习奠基---概率论基础知识_概率分布_111机器学习奠基---概率论基础知识_互斥_112

(5) 正态分布:机器学习奠基---概率论基础知识_机器学习基础_113 机器学习奠基---概率论基础知识_互斥_114

(6)指数分布:机器学习奠基---概率论基础知识_概率分布_115

(7)几何分布:机器学习奠基---概率论基础知识_概率分布_116

(8)超几何分布: 机器学习奠基---概率论基础知识_概率分布_117

6.随机变量函数的概率分布

(1)离散型:机器学习奠基---概率论基础知识_二维_118

则: 机器学习奠基---概率论基础知识_机器学习基础_119

(2)连续型:机器学习奠基---概率论基础知识_概率分布_120

则:机器学习奠基---概率论基础知识_机器学习基础_121机器学习奠基---概率论基础知识_概率论_122

7.重要公式与结论

(1) 机器学习奠基---概率论基础知识_机器学习基础_123 机器学习奠基---概率论基础知识_机器学习基础_124

(2) 机器学习奠基---概率论基础知识_机器学习基础_125

(3) 机器学习奠基---概率论基础知识_二维_126

(4) 机器学习奠基---概率论基础知识_概率分布_127

(5) 离散型随机变量的分布函数为阶梯间断函数;连续型随机变量的分布函数为连续函数,但不一定为处处可导函数。

(6) 存在既非离散也非连续型随机变量。

多维随机变量及其分布

1.二维随机变量及其联合分布

由两个随机变量构成的随机向量机器学习奠基---概率论基础知识_二维_128, 联合分布为机器学习奠基---概率论基础知识_概率论_129

2.二维离散型随机变量的分布

(1) 联合概率分布律 机器学习奠基---概率论基础知识_机器学习基础_130

(2) 边缘分布律 机器学习奠基---概率论基础知识_二维_131 机器学习奠基---概率论基础知识_二维_132

(3) 条件分布律 机器学习奠基---概率论基础知识_概率论_133
机器学习奠基---概率论基础知识_概率分布_134

3. 二维连续性随机变量的密度

(1) 联合概率密度机器学习奠基---概率论基础知识_二维_135

  1. 机器学习奠基---概率论基础知识_概率论_136
  2. 机器学习奠基---概率论基础知识_二维_137

(2) 分布函数:机器学习奠基---概率论基础知识_二维_138

(3) 边缘概率密度: 机器学习奠基---概率论基础知识_概率论_139 机器学习奠基---概率论基础知识_概率分布_140

(4) 条件概率密度:机器学习奠基---概率论基础知识_二维_141 机器学习奠基---概率论基础知识_概率分布_142

4.常见二维随机变量的联合分布

(1) 二维均匀分布:机器学习奠基---概率论基础知识_机器学习基础_143 ,机器学习奠基---概率论基础知识_概率论_144

(2) 二维正态分布:机器学习奠基---概率论基础知识_概率论_145,机器学习奠基---概率论基础知识_概率论_145

机器学习奠基---概率论基础知识_二维_147

5.随机变量的独立性和相关性

机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_概率论_149的相互独立:机器学习奠基---概率论基础知识_概率论_150:

机器学习奠基---概率论基础知识_二维_151(离散型)
机器学习奠基---概率论基础知识_互斥_152(连续型)

机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_概率论_149的相关性:

相关系数机器学习奠基---概率论基础知识_机器学习基础_155时,称机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_概率论_149不相关,
否则称机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_概率论_149相关

6.两个随机变量简单函数的概率分布

离散型: 机器学习奠基---概率论基础知识_概率论_160

机器学习奠基---概率论基础知识_机器学习基础_161

连续型: 机器学习奠基---概率论基础知识_概率论_162
则:

机器学习奠基---概率论基础知识_二维_163机器学习奠基---概率论基础知识_二维_164

7.重要公式与结论

(1) 边缘密度公式: 机器学习奠基---概率论基础知识_互斥_165
机器学习奠基---概率论基础知识_概率分布_140

(2) 机器学习奠基---概率论基础知识_概率论_167

(3) 若机器学习奠基---概率论基础知识_二维_128服从二维正态分布机器学习奠基---概率论基础知识_概率论_169
则有:

  1. 机器学习奠基---概率论基础知识_概率论_170
  2. 机器学习奠基---概率论基础知识_概率分布_171机器学习奠基---概率论基础知识_机器学习基础_172相互独立机器学习奠基---概率论基础知识_机器学习基础_173,即机器学习奠基---概率论基础知识_概率分布_171机器学习奠基---概率论基础知识_机器学习基础_172不相关。
  3. 机器学习奠基---概率论基础知识_概率论_176
  4. 机器学习奠基---概率论基础知识_概率分布_177关于机器学习奠基---概率论基础知识_概率论_178的条件分布为:机器学习奠基---概率论基础知识_二维_179
  5. 机器学习奠基---概率论基础知识_机器学习基础_172关于机器学习奠基---概率论基础知识_机器学习基础_181的条件分布为:机器学习奠基---概率论基础知识_机器学习基础_182

(4) 若机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_概率论_149独立,且分别服从机器学习奠基---概率论基础知识_机器学习基础_185
则:机器学习奠基---概率论基础知识_机器学习基础_186

机器学习奠基---概率论基础知识_概率论_187

(5) 若机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_概率论_149相互独立,机器学习奠基---概率论基础知识_概率论_190机器学习奠基---概率论基础知识_二维_191为连续函数, 则机器学习奠基---概率论基础知识_概率论_192机器学习奠基---概率论基础知识_概率论_193也相互独立。
6.随机变量函数的数学期望

(1) 对于函数机器学习奠基---概率论基础知识_机器学习基础_194

机器学习奠基---概率论基础知识_互斥_148为离散型:机器学习奠基---概率论基础知识_概率分布_196

机器学习奠基---概率论基础知识_互斥_148为连续型:机器学习奠基---概率论基础知识_概率分布_198

(2) 机器学习奠基---概率论基础知识_机器学习基础_199;机器学习奠基---概率论基础知识_概率论_200; 机器学习奠基---概率论基础知识_二维_201 机器学习奠基---概率论基础知识_机器学习基础_202;机器学习奠基---概率论基础知识_机器学习基础_203

7.协方差

机器学习奠基---概率论基础知识_互斥_204

8.相关系数

机器学习奠基---概率论基础知识_机器学习基础_205,机器学习奠基---概率论基础知识_概率分布_65阶原点矩 机器学习奠基---概率论基础知识_概率分布_207;
机器学习奠基---概率论基础知识_概率分布_65阶中心矩 机器学习奠基---概率论基础知识_机器学习基础_209

性质:

(1)机器学习奠基---概率论基础知识_二维_210

(2)机器学习奠基---概率论基础知识_概率论_211

(3)机器学习奠基---概率论基础知识_概率分布_212

(4)机器学习奠基---概率论基础知识_二维_213

(5) 机器学习奠基---概率论基础知识_机器学习基础_214 ,其中机器学习奠基---概率论基础知识_互斥_215

机器学习奠基---概率论基础知识_二维_216
,其中机器学习奠基---概率论基础知识_互斥_217

9.重要公式与结论

(1)机器学习奠基---概率论基础知识_互斥_218

(2)机器学习奠基---概率论基础知识_概率论_219

(3) 机器学习奠基---概率论基础知识_二维_220机器学习奠基---概率论基础知识_二维_221,其中机器学习奠基---概率论基础知识_互斥_215

机器学习奠基---概率论基础知识_二维_216,其中机器学习奠基---概率论基础知识_互斥_217

(4) 下面5个条件互为充要条件:

机器学习奠基---概率论基础知识_概率分布_225 机器学习奠基---概率论基础知识_机器学习基础_226 机器学习奠基---概率论基础知识_二维_227 机器学习奠基---概率论基础知识_互斥_228 机器学习奠基---概率论基础知识_概率论_229

注:机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_概率论_149独立为上述5个条件中任何一个成立的充分条件,但非必要条件。

数理统计的基本概念

1.基本概念

总体:研究对象的全体,它是一个随机变量,用机器学习奠基---概率论基础知识_互斥_148表示。

个体:组成总体的每个基本元素。

简单随机样本:来自总体机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_机器学习基础_61个相互独立且与总体同分布的随机变量机器学习奠基---概率论基础知识_概率分布_235,称为容量为机器学习奠基---概率论基础知识_机器学习基础_61的简单随机样本,简称样本。

统计量:设机器学习奠基---概率论基础知识_机器学习基础_237是来自总体机器学习奠基---概率论基础知识_互斥_148的一个样本,机器学习奠基---概率论基础知识_概率论_239)是样本的连续函数,且机器学习奠基---概率论基础知识_概率论_240中不含任何未知参数,则称机器学习奠基---概率论基础知识_概率论_239为统计量。

样本均值:机器学习奠基---概率论基础知识_二维_242

样本方差:机器学习奠基---概率论基础知识_概率分布_243

样本矩:样本机器学习奠基---概率论基础知识_概率分布_65阶原点矩:机器学习奠基---概率论基础知识_机器学习基础_245

样本机器学习奠基---概率论基础知识_概率分布_65阶中心矩:机器学习奠基---概率论基础知识_互斥_247

2.分布

机器学习奠基---概率论基础知识_概率分布_248分布:机器学习奠基---概率论基础知识_概率论_249,其中机器学习奠基---概率论基础知识_机器学习基础_237相互独立,且同服从机器学习奠基---概率论基础知识_互斥_251

机器学习奠基---概率论基础知识_机器学习基础_252分布:机器学习奠基---概率论基础知识_概率分布_253 ,其中机器学习奠基---概率论基础知识_机器学习基础_254机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_概率论_149

机器学习奠基---概率论基础知识_概率分布_257分布:机器学习奠基---概率论基础知识_二维_258,其中机器学习奠基---概率论基础知识_概率分布_259机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_概率论_149相互独立。

分位数:若机器学习奠基---概率论基础知识_概率分布_262则称机器学习奠基---概率论基础知识_概率论_263机器学习奠基---概率论基础知识_互斥_148机器学习奠基---概率论基础知识_概率论_265分位数

3.正态总体的常用样本分布

(1) 设机器学习奠基---概率论基础知识_概率分布_235为来自正态总体机器学习奠基---概率论基础知识_概率论_267的样本,

机器学习奠基---概率论基础知识_概率论_268则:

  1. 机器学习奠基---概率论基础知识_机器学习基础_269或者机器学习奠基---概率论基础知识_概率分布_270
  2. 机器学习奠基---概率论基础知识_机器学习基础_271
  3. 机器学习奠基---概率论基础知识_互斥_272

4)机器学习奠基---概率论基础知识_二维_273

4.重要公式与结论

(1) 对于机器学习奠基---概率论基础知识_互斥_274,有机器学习奠基---概率论基础知识_互斥_275

(2) 对于机器学习奠基---概率论基础知识_机器学习基础_276,有机器学习奠基---概率论基础知识_互斥_277

(3) 对于机器学习奠基---概率论基础知识_概率分布_278,有 机器学习奠基---概率论基础知识_概率论_279
(4) 对于任意总体机器学习奠基---概率论基础知识_互斥_148,有 机器学习奠基---概率论基础知识_概率论_281