SPSS软件的生命表分析:基本原理
生命表反映的是一代人在整个生命历程中的死亡过程,即在某个特定的年龄段内有多少人死亡,通过计算可以得知人群在该时点的死亡概率为多少、预期寿命为多少等。
生命表的基本思想是将整个观测时间划分为很多小的时间段,对于每个时间段,计算所有活到某时间段起点的病例在该时间段内死亡(出现结局)的概率。因此,当资料是按照固定的时间间隔收集(如一个月随访一次)时,随访结果只有该年或该月期间的若干观察人数、发生失效事件人数(出现预期观察结果的人数)和截尾人数(删失人数),每位患者的确切生存时间无法知道,就需要构造生命表进行分析。生命表用于大样本,并且对生存时间的分布不限,是目前广泛应用的一种非参数分析方法。
生命表中最重要的概念是生存时间,通常用下面三种函数来描述。
● 生存函数:在线性刻度上显示累积生存函数,指的是个体生存时间长于某时间t的概率。
● 概率密度函数:指的是生存函数的概率密度函数。
● 危险度函数:在线性刻度上显示累积风险函数,又称为风险函数、危险率函数等,指的是年龄为t的个体在t时刻死亡这个事件的概率密度函数。
这三个函数在数学上是等价的,给出一个就能推出另外两个。
在SPSS官方网站的简体中文帮助文档《 IBM_SPSS_Advanced_Statistics 》中,对于寿命表分析的应用条件和相关过程还进行了特别指导。
数据方面,寿命表分析要求时间变量是定量的,状态变量是以整数编码的二分变量或分类变量,事件编码为单值或一段连续值范围,因子变量是以整数编码的分类变量。
假设条件方面,用户所关心事件的概率只取决于初始事件之后的时间(假设绝对时间下的概率不变),即从不同时间开始研究的个案(如从不同时间开始接受治疗的患者)应有相似的行为。已审查的个案和未审查的个案之间也不应存在系统性差别。
例如,如果许多已审查的个案都是情况更为严重的患者,则得到的结果可能会存在偏差。相关过程方面,“寿命表”过程对此类分析(通常称为“生存分析”)使用保险精算方法。“Kaplan-Meier生存分析”过程使用略有不同的方法计算寿命表,此方法不依赖于将观察期划分为较小的时间区间。
如果用户获得的观察值数量较少,则建议使用此方法,这样每个生存时间区间内将只有较少数量的观察值。如果用户怀疑变量与要控制的生存时间或变量(协变量)相关,则应使用“Cox回归”过程。如果同一个个案中协变量在不同的时间点可以具有不同的值,则应使用带有“依时协变量”的“Cox回归”。