SAS软件数据分析的流程
如图2-2所示,在数据处理流程上,同R软件把所有数据都存在内存里进行计算不同,SAS读入各种来源的数据(可能是外部的原始数据,也可能是SAS可以直接打开的SAS数据文件),将其存储在硬盘的SAS数据集里,经过进一步的整理、清洗,把数据变成可以直接套用统计模型的数据集,然后运行统计模型、跑出统计分析结果、把结果进一步整理成表格、图片甚至是图文混排的报告,还可以把结果抓取出来另存为数据集,便于后续处理。
这个整理数据的过程通常是使用DATA步来完成的,分析数据的过程通常是使用PROC步来完成的,此即人们口中常说的SAS两步编程:DATA步整理数据、PROC步分析数据。
图2-2 SAS数据分析流程
当然,在实际导入、整理数据的过程中,也不仅仅只限于用DATA步,巧妙运用PROC步往往能事半功倍。同样,在PROC步做完分析后,也需配合用DATA步做进一步的结果整理,以便输出更易读的结果报告。