SPSS软件的数据探索:基本原理
数据探索是统计分析中非常重要的一步,可以帮助我们决定选择哪种统计方法进行数据分析,这是因为我们在搜集到数据并建立数据文件后,并非立即投入统计分析,数据结构、数据中隐含的内在统计规律等尚不清楚,需要对数据进行考察或探索。数据探索的目的主要有以下两点:
● 检查或发现数据中的错误:载入数据文件的数据不能保证都是准确无误的,需要检查一下其中有无异常数值,找出这些异常值,并分析这些数值产生的原因,决定是否可以剔除或修改。异常值主要包括错误数据、与绝大多数数值相比过大或过小的数据等。数据中包含的异常数据必然会影响分析结果,掩盖变量变化的真实规律和特征。
● 探索变量变化的分布特征:不同的随机变量服从不同的分布规律,需要采用不同的统计方法。例如,来自非正态分布的数据使用正态分析方法,自然不会得到期望的结果。因此,需要通过数据的探索对变量可能服从的分布类型加以确定。通过数据探索,可以使我们获得对变量统计规律的初步认识。
SPSS中的“探索”是在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,如茎叶图、箱图等,显得更加详细、全面,有助于用户制定继续分析的方案。