SAS Enterprise Miner的功能与特点
SAS的全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编写。他们于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,但该软件系统最早的功能仅限于统计分析。
至今,统计分析功能仍是它的重要组成部分和核心功能。经过多年的发展,SAS已被全世界120多个国家和地区的近3万家机构所采用,直接用户超过300万人,遍及金融、医药卫生、生产、运输、通信、政府和教育科研等领域。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在1996—1997年度被评选为建立数据库的首选产品,堪称统计软件界的“巨无霸”。
SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASE SAS模块。BASE SAS模块是SAS系统的核心,承担着主要的数据管理任务,管理用户的使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,必须首先启动BASE SAS模块。BASE SAS模块除本身具有的数据管理、程序设计及描述统计计算功能外,还是SAS系统的中央调度室。除可单独存在外,BASE SAS模块也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。
SAS系统具有灵活的功能扩展接口和强大的功能模块,在BASE SAS的基础上,还可以通过增加如下不同的模块来增加不同的功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)和SAS/AF(交互式全屏幕软件应用系统模块)等。
SAS有一个智能型绘图系统,不仅能绘制各种统计图,还能绘制地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。
SAS是由大型机系统发展而来的,其核心操作方式是程序驱动,其用户界面也充分体现了这个特点:采用MDI(多文档界面),用户在PGM视窗中输入程序,分析结果以文本的形式在OUTPUT视窗中输出。使用程序方式,用户可以完成所有工作,包括统计分析、预测、建模和模拟抽样等。但是,这使得初学者在使用SAS时必须学习SAS语言,入门比较困难。SAS的Windows版本根据不同的用户群开发了几种图形操作界面,这些图形操作界面各有特点,使用时非常方便。
SAS Enterprise Miner是一种通用的数据挖掘工具,按照“抽样→探索→转换→建模→评估”的方法进行数据挖掘。它可以与SAS数据仓库和OLAP集成,实现从抽取数据、提炼数据到数据挖掘结果的全流程。