“对应分析”方法的产生

2022年2月22日08:49:16“对应分析”方法的产生已关闭评论

对应分析的最早的奠基性工作出现于20世纪30年代。

Richardson和Kuder在1933年首先提出了互平均法,包含了对应分析的基本思想,缺点是他们在计算方法方面存在困难。Horst在1935年进一步明确了互平均方法的最优化原则,改进了前者的计算方法,把它用于二态变量,以后又把这种方法用于连续变量。Hirschfeld在1935年提出协同线性回归准则,给定离散的二元随机变量的分布求变量值,使得双方回归都是线性的。按这种方式求出的解,正是对应分析的解。

有趣的是这些工作一直没有引起人们的注意。在以后的几十年间,有许多著名统计学家仍然致力于这方面的研究,独立地提出了许多表面上不同实质上等价的最优化准则和计算方法。这里仅列出其中的某些重要工作。

Fisher在1940年研究人的眼睛颜色与头发颜色的关系时,求出关于两个定性变量的两组得分,所用的方法就是前边所说的互平均,他还指出,每组得分是另一组得分的线性回归。Maung在1941年研究了定性变量二维表的相关性度量问题,为对应分析提出了3个等价的准则,即求出行和列的得分,使能极大化。同一年,Guttman在研究多重选择数据时,用内部一致性作为对应分析的计算准则,求诸变量的权,以使样品内部离差平方和与总离差平方和之比极小化。他在1946年首次把这套方法用于研究成对比较数据和秩顺序数据,扩展了对应分析的应用范围。

日本学者林知已夫(C.Hayashi)在20世纪50年代建立了数量化理论,系统研究了定性数据的数量化方法。它的数量化理论所用的准则与Guttman的内部一致性准则基本一致,但他极大地推广了Guttman的结果,特别是在成对比较数据的多维数量化方面。针对Fisher和Maung的对应分析模型,Williams1952年参考判别分析给出了假设检验方法。Lancaster在1953年研究了将 χ 统计量用于假设检验的方法。

至此,对应分析的数学模型和计算方法都以严格的形式建立起来了。自20世纪60年代以后,又有许多著名的统计学家致力于这方面的研究。研究内容包括软件开发、计算方法的创新、扩大应用范围、改善应用效果等。这期间在理论上的重要进展是搞清了对应分析与其他多元统计方法的关系。

特别值得注意的是法国学者Benzecri等的工作。他们在20世纪六七十年代以法文发表了大量研究论文和著名的专著,又以数据矩阵的重新标度为基础提出了一种新的数学模型,首次采用了对应分析(Correspondance Analysis)的名字。由于他们的工作被大量引用,对应分析也就成了这类方法的比较通用的名字。

  • A+
所属分类:Spss
  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。