不管喜不喜欢数学课,你一定记得“小九九”,你一定知道“一一得一,一二得二”和“九九八十一”。“小九九”是学习乘法的第一课,也是最重要的乘法口诀。常言道:“万变不离其宗”,“小九九”便是乘法之“宗”,千变万化的乘法运算都是从“小九九”演化而来的。
统计学也有自己的“小九九”,它不是一个口诀,而是从很多典型概率问题中总结出的经验,我们称为概率分布,简称分布。
分布是随机变量的取值与其对应概率的关系。例如,抛硬币试验中,设反面为0,正面为1,随机变量X为抛出硬币的数值,X的分布如表4-1所示。又如,掷骰子试验中,随机变量Y为掷出的点数,Y的分布如表4-2所示。表4-1和表4-2就是随机变量的分布,利用分布,可以计算出随机变量的期望和方差。
表4-1 抛硬币试验中随机变量X的分布
表4-2 掷骰子试验中随机变量Y的分布
统计学家可不想一个个地列出随机变量的分布,他们要对随机变量归类,计算出同一类随机变量的分布、期望和方差。对上面的两个例子来说,抛硬币和掷骰子都属于等概率分布,即随机变量每个取值的概率都相等。如果我们知道了等概率分布的计算公式,就不需要列表格了,直接做个“伸手党”,套用公式就可以了,这就是统计学家研究分布的原因,也是我们学习分布的原因。