要评估一项统计研究的结果,不能只看它是否具有统计学显著性。
置信区间把我们对真实p值的了解(以95%的置信度)明白地表示出来。抛1000次和抛4040次硬币所得到的置信区间都包含了0.5这个数字,所以我们不会怀疑硬币不平衡。可是抛100000次的时候,我们却有把握认为真实的p值落在0.504~0.510的区间里。因此,我们可以认为p值不是0.5。
给出置信区间
置信区间提供的信息比显著性检验多,因为置信区间实际上估计了总体参数的值,而且置信区间也比较容易解释。因此,好的做法是尽可能地给出置信区间 。