1.生存时间
从特定起点开始到所研究事件发生的时间。事件发生的时间就是计时终点,这通常是比较好确定的,比如患者确实发生了死亡,计算机发生了报废,但计时起点很多时候难以确定,比如前面提及的患者患病,如果是慢性疾病,那么具体发病时间可能是难以及时记录或追溯的。生存时间的特点有:分布类型不确定,一般不服从正态分布;影响生存时间的因素较为复杂,而且不易控制。
2.事件及事件发生
这是界定生存时间的前提,事件的发生意味着生存时间的记录终点,比如患者发生了死亡,那么死亡就是时间,死亡发生就是事件发生。明确事件及事件发生的具体情形是开展生存分析的必要前提,而且必须在数据收集之前完成,不然就会导致收集的数据质量不足以支撑完成分析过程。
3.删失/失访
删失本质就是研究数据出现了缺失,或者称为研究对象失访的现象,如果出现删失,表明患者虽然被观察了一段时间,事件未出现,但研究对象联系不到了,从而无法得到该对象完整的生存时间。删失分为右删失、左删失和期间删失3种,右删失的情况最为常见。右删失是指只知道生存时间大于某一时间点;左删失是指生存时间小于某一时间点;区间删失是指只知道生存时间在某一段时间之内。
4.截尾值
存在数据删失的研究对象仍然有分析价值,因为在删失发生之前,仍提供了部分生存时间,可以称之为不完全生存时间或者截尾值。截尾值的具体概念为:有的观察对象终止随访不是由于失败事件发生,而是由于中途失访、死于非研究事件所致原因、随访截止导致的。由于不知道这些研究对象发生事件的具体时间,他们的资料不能提供完全的信息,这些研究对象的观察值也就被称为截尾值,常用符号“+”表示。
5.生存概率
生存概率表示某单位时段开始时,存活的个体到该时段结束时仍存活的可能性。计算公式为:生存概率=活满某时段的人数/该时段期初观察人数=1-死亡概率。
6.生存时间分布
生存时间分布是一种概率分布,使用概率函数来表示,具体包括生存函数和风险函数。
生存函数又称为累计生存概率,即将时刻 t 尚存活看成是前 t 个时段一直存活的累计结果,若 T 为生存时间变量,生存函数就是 T 越过某个时点 t 时,所有研究对象中没有发生事件的概率。当 t =0时,生存函数的取值为1,随着时间的推移( t 值增大),生存函数的取值逐渐变小,生存函数是时间 t 的单调递减函数,生存函数公式为:
其中, F ( t )为分布函数, S ( t )又称为可靠度函数或可靠度, f ( t )为 X 的分布密度函数。