基于我们最为熟悉的离散型分布——二项分布,我们能够衍生出很多别的分布列,对于之前介绍过的几何分布,我们赋予其的含义是:某个事件成功的概率是p,在n次独立重复实验中恰好成功一次的概率是多少。顺着这层含义,我们把1次编程r次,便得到了所谓的负二项分布。设负二项分布的随机变量是X表示独立重复试验成功恰好成功r次需要总共实验的次数,独立事件成功的概率是p:
其中n=r,r+1,……
较之二项分布,我们能够看到,基于基本的二次分布的n次独立实验,二项分布是在实验次数n确定的情况下,随机变量是独立实验成功的次数X。而负二项分布是在独立实验成功次数r确定的情况下,随机变量实验总共进行的次数X。
我们通过一个问题来进行举例——巴拿赫火柴问题。
Q:某个抽烟的数学家总是随身带着两盒火柴,一盒放在左边口袋一盒放在右边口袋。每次他需要火柴时,他就从任意的口袋中的火柴盒中取出一个火柴,现在两盒火柴中都各有N个火柴,那么请问他第一次发现其中一个盒子已经空了的时候,另一盒恰好有k根火柴的概率有多大?
分析:首先我们需要讨论的一个点是,这个火柴位于哪个口袋的火柴盒是空的,显然是左是右具有对称性,我们分析一种情况,选择该种情况需要是需要1/2的概率,即在最终结果中应该乘2。
我们假设左口袋取光。
能够看到,这个问题中对应着二项分布,它的成功次数是一定的,即在我们的假设下,取左口袋的次数是N,这是确定的,然后右口袋的剩余量k是变量,也就是说进行多少次重复实验是变量,这与负二项分布是刚好吻合的。
那么下面我们应该做的就是找到这个过程的r、p参数。
这里需要搞清楚一个细节问题,“数学家第一次发现一个盒子是空”,与“另一个盒子恰好有…”这两句描述。这里默认数学家并不会记录火柴盒里的火柴树,因此数学家“发现”这个动作加一次选取左口袋的次数的。因此r=N+1,X=2N-k+1
即
当然,这道问题的最终结果是将这个概率2倍。