概率是频率的稳定值,频率是概率的近似值;
以抛硬币为例,我们都知道一个常识,抛硬币出现正面或反面的概率是50%,注意这里我们用的是概率;
有些人不相信,说我抛了2次,都是正面朝上^_^,你也就是抛了2次而已,历史上有很多数学家也做过抛硬币的实验,比如蒲丰、德·摩根、费勒、皮尔逊、罗曼诺夫
斯基等,不同于常人随便抛几次,人家不仅实验次数多,并且还有记录,如:
实验者 | 实验次数 | 正面朝上次数 | 正面次数占比 |
蒲丰 | 4040 | 2048 | 50.69% |
德摩根 | 4092 | 2048 | 50.05% |
费勒 | 10000 | 4979 | 49.79% |
皮尔逊 | 24000 | 12012 | 50.05% |
罗曼洛夫斯基 | 80640 | 39699 | 49.23% |
可以发现,正面朝上的次数占比在50%左右徘徊,由此我们引入定义
定义1:设E为随机实验,A为其中任一事件,n(A)为事件A在n次重复实验中出现的次数,则称比值n(A)/n为n次实验中事件A出现的频率,记为
f_n(A)=n(A)/n。
当n增大时,f_n(A)逐渐稳定于某个确定值p(A),称p(A)为事件A的频率的稳定值
上面抛硬币的实验,正面朝上是一个事件,反面朝上是一个事件
由抛硬币实验可见,用频率来刻画事件A(即正面朝上)发生的可能性大小,比较直观,但它有随机波动的缺陷,即在一定条件下做重复实验,其结果可能是不一样的。因此,用频率的稳定值来刻画事件A发生的可能性大小是比较恰当的,现在引出概率的统计性定义:
定义2:在不变条件下做大量重复实验,重复实验中事件A发生的频率的稳定值p,我们称p为事件A的概率,记为p(A)。
聪明的同学发现了,定义中有这样的描述“大量重复实验”,实际生活中,我们不可能对每件事都通过做反复实验来得到p(A)。为此,以频率的性质和频率的稳定值为背景,采用抽象的方法,我们来给出p(A)的一般定义。
定义3:设E为随机实验,Ω为它的样本空间,对E中的每一个事件A都赋予一个实数,记为p(A),且满足:
(1)非负性:0≤p(A)≤1
(2)规范性:p(Ω)=1
(3)可加性:若A1,A2,A3,...,An,...,两两互不相容,有
p(UAi)=∑p(Ai)
则称p(A)为事件A的概率。
由定义得到概率p(A)的性质如下:
(1)p(Ø)=0
(2)若A1,A2,A3,...,An,两两互不相容,有p(UAi)=∑p(Ai),i=1,...,n
(3)若事件A的对立事件记为A^,则p(A)=1-p(A^)
(4)若A⊂B,则p(B-A)=p(B) - p(A)
(5)p(A∪B) = p(A) + p(B) - p(AB)