概率是频率的稳定值,频率是概率的近似值;

以抛硬币为例,我们都知道一个常识,抛硬币出现正面或反面的概率是50%,注意这里我们用的是概率;

有些人不相信,说我抛了2次,都是正面朝上^_^,你也就是抛了2次而已,历史上有很多数学家也做过抛硬币的实验,比如蒲丰、德·摩根、费勒、皮尔逊、罗曼诺夫

斯基等,不同于常人随便抛几次,人家不仅实验次数多,并且还有记录,如:

实验者

实验次数

正面朝上次数

正面次数占比

蒲丰

4040

2048

50.69%

德摩根

4092

2048

50.05%

费勒

10000

4979

49.79%

皮尔逊

24000

12012

50.05%

罗曼洛夫斯基

80640

39699

49.23%

可以发现,正面朝上的次数占比在50%左右徘徊,由此我们引入定义

定义1:设E为随机实验,A为其中任一事件,n(A)为事件A在n次重复实验中出现的次数,则称比值n(A)/n为n次实验中事件A出现的频率,记为

f_n(A)=n(A)/n。

当n增大时,f_n(A)逐渐稳定于某个确定值p(A),称p(A)为事件A的频率的稳定值

上面抛硬币的实验,正面朝上是一个事件,反面朝上是一个事件

由抛硬币实验可见,用频率来刻画事件A(即正面朝上)发生的可能性大小,比较直观,但它有随机波动的缺陷,即在一定条件下做重复实验,其结果可能是不一样的。因此,用频率的稳定值来刻画事件A发生的可能性大小是比较恰当的,现在引出概率的统计性定义:

定义2:在不变条件下做大量重复实验,重复实验中事件A发生的频率的稳定值p,我们称p为事件A的概率,记为p(A)。

聪明的同学发现了,定义中有这样的描述“大量重复实验”,实际生活中,我们不可能对每件事都通过做反复实验来得到p(A)。为此,以频率的性质和频率的稳定值为背景,采用抽象的方法,我们来给出p(A)的一般定义。

定义3:设E为随机实验,Ω为它的样本空间,对E中的每一个事件A都赋予一个实数,记为p(A),且满足:

(1)非负性:0≤p(A)≤1

(2)规范性:p(Ω)=1

(3)可加性:若A1,A2,A3,...,An,...,两两互不相容,有

                        p(UAi)=∑p(Ai)

则称p(A)为事件A的概率。

由定义得到概率p(A)的性质如下:

(1)p(Ø)=0

(2)若A1,A2,A3,...,An,两两互不相容,有p(UAi)=∑p(Ai),i=1,...,n

(3)若事件A的对立事件记为A^,则p(A)=1-p(A^)

(4)若A⊂B,则p(B-A)=p(B) - p(A)

(5)p(A∪B) = p(A) + p(B) - p(AB)