SPSS多元Logistic回归分析:基本原理
多元Logistic回归分析常用于因变量为多分变量时的回归拟合。
在许多领域的分析中,我们都会遇到因变量只能取多个单值的情形,如教师职称、医师级别等。对于这种问题建立回归模型,与二元Logistic回归的基本思想类似,通常先将取值在实数范围内的值通过Logit变换转化为目标概率值,然后进行回归分析,但是考虑到因变量不止有两种取值的情况,就称为多元Logistic回归。多元Logistic回归参数的估算通常采用最大似然法,最大似然法的基本思想是先建立似然函数与对数似然函数,再通过使对数似然函数最大求解相应的参数值,所得到的估算值称为参数的最大似然估计值。
多元Logistic模型的数学表达式为:
SPSS官方网站的帮助文档《 IBM_SPSS_Regression 》中指出,SPSS 25.0的多项Logistic回归提供了以下独特的功能。
● 模型拟合度优度Pearson和偏差卡方检验。
● 对进行拟合优度检验的数据指定分组的子群体。
● 按子群体列出的计数、预测计数和残差。
● 对过度离散的方差估算值的修正。
● 参数估算的协方差矩阵。
● 参数线性组合的检验。
● 嵌套模型的显式指定。
● 使用差分变量拟合匹配的条件Logistic回归模型。
需要说明的是,二元Logistic回归过程和多项Logistic回归过程都可以拟合用于二分类数据的模型,该模型是使用二项式分布和logit关联函数的广义线性模型。但如果其他关联函数更适合用户数据的情况下,就应该不再局限于“回归分析”模块,而是使用更加优良的“广义线性模型”过程。此外,如果用户具有二分类数据的重复测量或以其他方式相关联的记录,就应该考虑更为合适的“广义线性混合模型”或“广义估计方程”过程。