有一个很特别的分布,叫作几何分布,这个分布告诉人们,什么时候才能实现第一次。
仍以抛硬币为例,已知出现正反两面的概率各为1/2,在反复抛掷的过程中,我们设定随机变量X表示第一次出现反面时抛掷硬币的次数,我们列出X的概率分布,如表4-3所示。
表4-3 第一次出现反面时抛掷硬币的次数X的分布
用数学公式来表达为
P(X=k)=(1/2)k-1×(1/2),k=1,2,3,…
式中,(1/2)k-1表示前k-1次都是正面,乘号后边的1/2表示第k次是反面。
这个例子有些特殊,因为正面和反面出现的概率相同,如果不相同会怎样呢?我们以骰子游戏为例。
已知骰子有六种点数,每个点数出现的概率都是1/6,反复抛掷骰子,设定随机变量Y表示第一次出现六点时抛掷骰子的次数,我们列出Y的概率分布,如表4-4所示。
表4-4 第一次出现六点时抛掷骰子的次数Y的分布
用数学公式来表达为
P(Y=k)=(5/6)k-1×(1/6),k=1,2,3,…
式中,(5/6)k-1表示前k-1次都不是六点,1/6表示第k次是六点。
透过两个例子,我们可以归纳出几何分布的通用表达。
设随机试验有且只有两种结果A和B,A出现的概率是p,B出现的概率是1-p,反复进行该随机试验,随机试验之间彼此独立,随机变量X表示A第一次出现时随机试验进行的次数,此时我们称随机变量X服从几何分布:
P(X=k)=(1-p)k-1·p,k=1,2,3,…
图4-1是几何分布的概率分布图,从图中可以明显地看出,虽然X的取值有无穷多个,但是X=1的概率是最大的,也就是说,1次成功的可能性最大。
几何分布是一个无限可列的概率分布,要计算它的期望和方差需要使用一些数列求和的计算技巧,我们不细究这些计算技巧,直接给出几何分布的期望和方差。
E(X)=1/p
Var(X)=(1-p)/p2
几何分布的期望与我们的直觉不谋而合。比如,硬币出现反面的概率是1/2,那么平均意义上需要抛2次才会出现反面;骰子的六点出现的概率是1/6,那么平均意义上需要掷6次才能出现六点;中一次彩票大奖的概率是百万分之一,那么平均意义上需要买一百万次才能中一次大奖。
图4-1 几何分布
几何分布只适用于反复进行的独立试验,这一点很容易被人们忽视,我们用两个例子来说明。
例1:选手A参加“一站到底”的选拔考试,题目分三类,历史类、体育类和文学类,每一轮答题,A要从三类题目的混合题库中随机抽取一道题作答。假设A只擅长历史类问题,那么,A答对第一道题平均需要多少轮?
例2:选手A参加“一站到底”的选拔考试,题库只有三个问题,分别属于历史类、体育类和文学类,每一轮答题,A要从三个问题中随机抽取一个作答,作答后该题随即作废。假设A只擅长历史类问题,那么,A答对第一道题平均需要多少轮?
这两个例子类似于抽样中的重复抽样和不重复抽样。例1属于重复抽样,A每一轮答题彼此独立,而且答对的概率相同,都是1/3,因此,例1是典型的几何分布,期望是1/(1/3)=3,所以例1的答案是3轮。在例2中,如果A第一轮没答对,第二轮答对的概率就会变为1/2,如果进入第三轮,他答对的概率更是100%,每轮答题的结果会改变后面轮次的概率,因此各轮之间不是互相独立的,所以例2不能用几何分布来解释。我们简单计算一下便会发现,例2中A在第一、二、三轮首次答对的概率都是1/3,因此,他首次答对问题所需的平均轮次是(1/3)×(1+2+3)=2,即A平均只需要两轮就可以答对一个问题。两个相对比,不重复抽样的规则更有利于A。