SPSS软件的尺度分析:基本原理
尺度分析用来分析样本数据间的相似性,如果数据为不相似性数据,则它们必须为数值型数据或是使用相同计量单位计量的数据。如果数据为多元变量,则数据可以是等间隔数据、二分数据或计数数据。注意应该保持数据量度单位的一致性,否则将会影响到分析结果。如果不能避免这种情况的出现,则必须对数据进行标准化(在此分析过程中可以自动解决)。
多维尺度分析没有严格的假设要求,但在选择测量水平时应该十分小心。在相似数据的情况下,用较大数值表示非常相似,用较小的数值表示非常不相似,比如用7表示非常相似,1表示两个商场非常不相似。如果用较大的数值表示非常不相似,较小的数值表示非常相似,则数据为不相似数据,也称距离数据。比如用7表示非常不相似,用1表示两个商场非常相似。
在SPSS官方网站的帮助文档《 IBM_SPSS_Statistics_Base 》中,对于尺度分析的应用条件和相关过程还进行了特别指导。
数据方面,如果数据是非相似性数据,那么所有的非相似性都应该是定量的,应该用相同的标度进行度量。如果数据是多变量数据,则变量可以为定量数据、二分类数据或计数数据。变量标度是一个重要问题,标度之间的差异可能会影响解。
如果变量在标度上有很大差异(如一个变量以美元为单位度量,而另一个以年数为单位度量),那么应该考虑对它们进行标准化(这可以通过多维标度过程来自动完成)。
假设条件方面,相对来讲,多维标度过程没有分布假定,用户需要确保在“多维标度:选项”对话框中选择适当的测量级别(有序、定距或定比)以确保正确计算结果。
相关过程方面,如果用户的目标是减少数据,特别当变量为定量时,就可以考虑使用另一种方法,即因子分析。
如果用户要确定相似个案的组,则考虑使用分层聚类或k-means聚类分析补充多维标度分析。