生存资料的特点:有截尾数据、不服从正态分布
生存期不同于一般指标的两个特点如下:
① 有截尾数据(Censored Data)。
随访中未能知道病人的确切生存时间,只知道病人的生存时间大于某时间。
• 人失访或因其他原因而死亡——失访;
• 到了研究的终止期病人尚未死亡——终访。
截尾数据可记为t+,如4+=生存时间大于4年。虽然截尾数据提供的信息是不完全的,但不能删去,因为这不仅损失了资料,而且会造成偏性。
② 生存期的资料一般不服从正态分布。
由于上述原因,常用的统计方法不适用,而要用特殊的统计方法。生存分析是指对于生存期这一指标进行分析的一系列特殊的统计方法。
生存时间不一定专用于死与活的情况,生存时间(存活时间)可定义为从某种起始事件到达某终点事件所经历的时间跨度。例如,急性白血病病人从治疗开始到复发为止之间的缓解期;冠心病病人在两次发作之间的时间间隔。在流行病学研究中,从开始接触危险因素到发病所经历的时间等都可作为生存时间用做生存分析。
有时还收集一些有关因素(称为自变量或协变量),以分析这些协变量是否对生存时间有影响,影响的大小,是缩短还是延长生存时间。这可以通过COX回归进行分析,因此,COX回归可看成带有协变量的生存分析。