数据挖掘的发展历程
数据挖掘虽然是计算机应用领域的新名词,但也经历了几十年的发展历程。
●第一阶段:1960年以后,各种新兴的数据收集模式开始出现,例如磁带、软盘、硬盘等,人们开始掌握了收集数据的基本方法。
●第二阶段:1980年以后,随着收集的数据量的增多,人们开始需要数据库,并逐渐建立起了数据库,但是此时还不能查询数据。
●第三阶段:1990年以后,数据统计的概念出现,人们可以进入数据仓库完成简单的数据统计,但并不能做太精细的决策。
●第四阶段:2000年以后,随着数据库和计算机网络的广泛应用,加上使用先进的自动数据生成和采集工具,人们所拥有的数据量急剧增大。针对大规模数据的分析处理方法——数据挖掘出现了。
数据挖掘在各行各业中都有应用,比如其最早应用于银行、通信业,现在也在零售业、保险业及政府中有所应用。
1.银行
金融事务需要收集和处理大量数据,由于银行在金融领域的地位、工作性质及业务特点,市场竞争激烈程度决定了它对信息化、电子化的需求比其他领域更迫切。利用数据挖掘技术可以帮助银行产品开发部门描述客户以往的需求并预测未来。例如,汇丰银行对不断增长的客户群进行分类,为每种产品找到最有价值的客户,这样其产品才能推销得好,而且比盲目推销产品节省了30%的销售费用。再例如,银行通过数据挖掘发现,有盗刷信用卡行为的人,其使用信用卡的第一笔消费往往小于10元,所以,银行根据这条规律,冻结了那些第一笔消费小于10元的客户的账号,减少了客户盗刷信用卡所带来的经济损失。
2.零售业
在过去,零售商依靠供应链软件、内部分析软件甚至直觉来预测库存需求。随着竞争压力一天天地增大,很多零售商都开始致力于找到更准确的方法来预测其连锁商店应保有的库存。通过数据挖掘可以为产品存储决策提供准确、及时的信息。
3.保险业
对受险人员进行分类有助于确定适当的保险金额度。通过数据挖掘可以得到不同行业、不同年龄段、不同社会层次的人的信息,从而可以评估他们的保险金。另外,还可进行保险金种类关联分析,分析购买了某种保险的人是否又同时购买了另一种保险,也可预测什么样的顾客会购买新险种。总而言之,数据挖掘在保险业中有广泛的应用。
4.政府
数据挖掘被广泛应用于电子政务中的综合查询、经济分析、宏观预测、应急预警、风险分析及预警、质量监督管理及监测、决策支持等系统,它为公众提供了一个智能化、高效的网上政府。例如,几乎每个政府网站都有类似“公众意见调查”的栏目,这是了解公众需求的一个很好的途径,但是从网站公布的调查结果看,其结论大多还停留在对单个问题求总数、求比例等简单分析上。利用数据挖掘技术可以在网上建立一个能有效地收集、监测和分析公众数据的系统,提炼出实用、有效的信息,建成以公众需求为主导的电子政务。将数据挖掘技术引入电子政务,可大大提高整个电子政务系统的智能化水平。