显著性检验面临的困难:缺点不足

2021年2月19日14:10:22显著性检验面临的困难:缺点不足已关闭评论

显著性检验面临的困难:缺点不足

显著性检验的目的,通常是找到总体中存在某种效应的证据。这里说的效应,也许是指抛硬币正面朝上的概率不是一半,或者采用新疗法的癌症病人平均存活时间较长。如果效应够大,就会在大部分样本中显现出来——我们抛硬币得到的正面朝上的比例会和一半相去甚远,或者使用新疗法的病人会比控制组的病人多活很长时间。如果效应较小,比如正面朝上的概率和一半差不多,则通常会被样本的随机性变异掩盖住。毋庸置疑,大的效应比较容易被我们注意到。换句话说,当总体真实值离零假设很远的时候,P值通常会很小。

显著性检验的主要“弱点”是,它只度量不利于零假设的证据强度,而不能度量我们正在寻找的总体效应到底有多大或多重要。举例来说,我们的假设可能是“这个硬币是平衡的”。我们把这个假设用正面朝上的概率p表示成H :p=0.5。真正的硬币没有哪一个是百分之百平衡的,所以我们知道这项假设并不正确。如果这个硬币正面朝上的概率是p=0.502,从实际角度来看,我们可能就会认为它是平衡的。但是统计检验可不管什么“实际”,它只会问是不是有足够的证据显示p并不恰好是0.5。检验把焦点放在不利于某个确切的零假设的证据强度上面,这一点是应用检验时许多困扰的来源。

当你看一项显著性检验的结果时,要特别注意样本大小。理由如下:

• 较大的样本会提高显著性检验的敏感度。如果我们抛硬币几十万次,则对于H :p=0.5的检验往往会得到很小的P值(这枚硬币真实的p值是0.502)。检验结果并没有错(它找到了合理的证据,证明p的确不是0.5。)但是,它把这么小的差异找出来,实在没什么实用价值。一项发现可能具有统计学显著性,却没有实际意义。

• 另一方面,用小样本做的显著性检验敏感度较差。如果你抛硬币10次,在检验H :p=0.5时,即使这个硬币真实的p=0.7,检验结果的P值也往往较大。这回检验仍然是正确的,因为只掷10次原本就不足以提供不利于零假设的合理证据。不具有统计学显著性并不代表效应不存在,而只能说我们没有找到合理的证据证明它。小样本常常会漏掉总体中确实存在的效应。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。