假设检验中如何控制两类错误发生的概率?
答案:
同时控制两类错误,这是难以实现的。主要原因在于第一类错误和第二类错误是一对矛盾,在其他条件不变时,减少犯第一类错误的可能性,势必增加犯第二类错误的可能性,即产生原假设是不真实的而被接受的错误。
要同时减少第一类、第二类错误的概率,只有增加样本量,但在实际工作中,不可能无限增大样本容量,因而控制第一类错误便是更切实际的方法。在这样的原则下,就可以主要控制犯第一类错误的概率 α ,即只分析原假设 H 0,并称这样的假设为显著性检验,称 α 为显著水平。
如果用 β 表示接受不真实的原假设的概率,那么1 -β 就是表示拒绝不真实的原假设的概率,1 -β 的值接近于1,表示不真实的原假设几乎都能够加以拒绝,反之,1 -β 接近于0,表示犯第二类错误的可能性是很大的,因此1 -β 是表明检验工作做得好坏的一个指标,称为检验功效或者检验效能。
一般来说,检验功效与备择假设的真值和不真实的原假设距离有关,离原假设越远的检验功效也越高,但是由于备择假设的真值通常是不知道的,而且 β 的大小与显著水平 α 成反比变化,因此在假设检验时总是将冒第一类错误的风险概率固定下来,对所得的结果进行判断。
由于 α 可以根据实际需要进行人为设定,而 β 不能随意进行设定,一般情况下,我们也不知道 β 的大小,通常而言检验功效受样本量、抽样误差和总体方差的影响。
什么是假设检验的两类错误
原假设究竟是真实还是不真实,事实上是不知道的。在参数检验中,接受零假设仅仅由于它出现的可能性比较大,而拒绝原假设也仅仅由于它出现的可能性比较小。这样按概率大小所做的判断,并不能保证百分百的正确,不论是接受原假设还是拒绝原假设,都可能犯错,总是要承担一定的风险。
举个例子,某投资者手上有很多闲置资金想要找项目,他通过调研后发现某项目P很有可能能赚大钱,于是就投进去了。最近坊间传闻该项目马上要撤回了,那他是继续持有还是立即撤出投资?
这个问题的关键就在于消息的真实性。
这个投资者第一反应是假设传闻是真实的,并着手进行调查,如果传闻的真实性不小于95%,那他就认为传闻是可靠的,否则就是不可靠。
于是他通过各种渠道进行调查,发现传闻的真实性有96%,但并不是百分百。他需要做出抉择,但是需要冒两个风险。
第一,传闻是真实的,但是他认为真理掌握在少数人手里,这就有可能犯第一类错误,犯错概率为 α =4%。
第二,传闻是假的,但是他认为应该遵从多数意见,这就有可能犯第二类错误,犯错概率为 β 。但是 β 并不一定等于96%。这是因为如果原假设是传闻是假的,我们需要以此为基础找证据,最后得到的检验概率并不一定是96%。这和以传闻为真为原假设的出发点有很大不同。
以上所做的判断包括以下4种情况。
1)原假设是真实的,而做出不拒绝原假设的判断,这是正确的决定。
2)原假设是不真实的,而做出拒绝原假设的判断,这是正确的决定。
3)原假设是真实的,而做出拒绝原假设的判断,这是犯了第一类错误。
4)原假设是不真实的,而做出不拒绝原假设的判断,这是犯了第二类错误。
上述4种情况的内容总结见表2-4。
表2-4 假设检验结论和风险
在做检验决策的时候,当然希望所有真实的原假设都能得到接受,尽量避免真实的假设被拒绝,少犯或不犯第一类错误。也希望所有不真实的假设都被拒绝,尽量避免不真实的假设被接受,少犯或不犯第二类错误。
因此需要对可能犯第一类错误和第二类错误的概率进行分析。
假设检验建立在小概率事件几乎不会发生的原理基础上,给定显著水平 α ,如果样本均值和总体均值的差异出现的概率等于或小于 α ,则认为此事件可能性很小,因此就拒绝原假设。但是这个差异的发生并不是完全不可能,而是有 α 的可能性存在。也就是说,有 α 的可能性发生原假设是真实的而被拒绝了,所以显著水平 α 实际上就是犯第一类错误的概率, α 也称为拒真概率。