IBM SPSS Modeler:使用简介、相关节点
IBM SPSS Modeler(以下简称SPSS Modeler)是一组数据挖掘工具,通过它可以快速建立预测模型,并将其应用于商业活动中,从而改进决策过程。
使用 SPSS Modeler处理数据主要分为3个步骤。
●首先,将数据读入 SPSS Modeler中。
●然后,通过一系列操作运行数据。
●最后,将数据发送到目标位置。
这个操作过程被称为数据流,因为数据以一条条记录的形式,依次经过各种操作,最终到达目标位置(模型或某种数据输出)。
数据流工作区是SPSS Modeler 窗口中最大的区域,也是构建和操作数据流的区域,如图1-2所示。
图1-2
SPSS Modeler 中的大部分数据和建模工具位于节点选项卡中,该选项卡位于数据流工作区(简称工作区)的底部(见图1-3)。要将节点添加到工作区中,在节点选项卡中双击节点对应的图标或将其拖曳到工作区中即可。随后可将各个图标连接以创建一个数据流。每个选项卡中均包含一组不同的数据流操作阶段中使用的相关节点,例如:
图1-3
●源(Source)节点。此类节点可将数据引入 SPSS Modeler中。
●记录选项(Record Ops)节点。此类节点可对数据记录执行操作,例如选择、合并和追加等。
●字段选项(Field Ops)节点。此类节点可对数据字段执行操作,例如过滤、导出新字段和确定给定字段的测量级别等。
●图形(Graphs)节点。此类节点可在建模前后以图表形式显示数据。图表形式包括散点图、直方图、网络节点和评估图表。
●建模(Modeling)节点。此类节点可使用SPSS Modeler中提供的建模算法,例如神经网络、决策树、聚类算法和数据排序等。
●输出(Output)节点。此类节点可生成能在 SPSS Modeler 中查看的数据、图表和模型等多种输出结果。
●导出(Export)。此类节点可生成能在外部应用程序中查看的多种输出结果。
●IBM SPSS Statistics(P)。此类节点可将数据导入SPSS Statistics 或从中导出数据,以及运行SPSS Statistics 。