与总体均数的估计相似,样本率是总体率的点估计值。由于点估计的波动较大,因此,我们还需要知道总体率大概会在一个什么样的区间范围内,即所谓总体率的可信区间估计。
根据资料的分布特征,如样本容量 n 与样本率 p 的大小,总体率的可信区间可以用正态分布法估计。当 n 足够大,且 p 和1 − p 均不太小,如 np 和 n (1− p )均大于5时, p 的抽样分布逼近正态分布。此时,可根据正态分布的特性计算总体率的可信区间。
双侧:
单侧:
例1-1
采用某药治疗高血压患者200例,服药一月后160人有效,试估计该药的有效率及其双侧95%可信区间。
解该药总体有效率: p = 160/200 = 80%, S p = 0.028 28
u 0.05/2 = 1.96,总体有效率的95% CI 为:
即估计该药的有效率为80%,该药的有效率的95%可信区间为(0.744 6,0.855 4)。
值得注意的是,在计算可信区间时,有可能遇到可信区间的下限小于0%(即负值),或可信区间的上限大于100%的情形。此时,应相应地将可信区间的下限表达为0%,可信区间的上限表达为100%。