数据挖掘平台(TipDM)的产品特点

2020年9月21日16:39:07数据挖掘平台(TipDM)的产品特点已关闭评论

数据挖掘平台(TipDM)的产品特点

广州TipDM团队一直致力于基于云计算的海量数据挖掘,借鉴WEKA、MATLAB、R和Mahout的优点,基于Hadoop并行计算平台,采用MapReduce计算模型,研发出高性能海量数据挖掘算法平台,有以下主要特点。

 支持CRISP-DM数据挖掘标准流程

CRISP-DM是数据挖掘的标准商业流程,与仅仅局限在技术层面上的数据挖掘方法论不同,CRISP-DM把数据挖掘看作一个商业过程,并将其具体的商业目标映射为数据挖掘目标。有调查结果显示,目前绝大部分数据挖掘工具均采用CRISP-DM的数据挖掘流程,它已经成为事实上的行业标准。

TipDM完全支持CRISP-DM标准,这不但规避了许多常规错误,而且其显著的智能预测模型有助于快速解决出现的问题。

 提供丰富的数据挖掘模型和灵活算法

TipDM提供多种数据挖掘建模方法,这些方法分别来自于机器学习、人工智能和统计学。每种方法都有自己的长处,并且可以整合在一起使用,可以灵活的解决各种类型的问题。这些模型算法分成五类:数据探索与预处理、分类与回归、聚类分析、关联规则挖掘、时序模式。具体算法如BP神经网络、RBF神经网络、灰色系统、决策树、决策表、贝叶斯、懒惰算法、支持向量机、K-均值聚类、Apriori关联规则、HotSpot关联规则、回归分析、指数平滑、季节移动平均及组合算法,运用这些算法可实现函数逼近、数据聚类、模式分类、优化计算等功能。

 具有多模型的整合能力

TipDM通过数据流的方式构建数据挖掘模型,用户可以把不同模型按照需求顺次连接就可以达到整合多个模型的目的。举例来说,建模前用户可以选择先对样本属性进行主成分分析或对属性选择进行降维处理,然后再指定某个算法进行建模。另外TipDM还提供了多种模型效果的评估技术和思路(例如收益图表、投资回报图表、利润图表、响应图表及各类表格等)来检验模型的效果,从而使用户可以选择最稳定、高效的模型进行发布。

TipDM的多模型整合能力,使得生成的模型更加稳定和高效。

 提供灵活多样的应用开发接口

TipDM提供一套基于行业标准的编程接口及常用的数据挖掘算法。它可用于开发各类数据挖掘应用程序,从简单的预测建模到庞大的集成系统。数据引擎可由JDBC和XML访问分析行业标准数据挖掘API。

TipDM提供Web Service、DLL和JAR三种不同的使用接口,方便第三方软件商集成开发,快速构建出大型企业级海量数据挖掘应用系统。

 海量数据的处理能力

TipDM高级版本是基于云计算平台分布式文件系统HDFS、并行计算框架MapReduce和MPP数据仓库基础上搭建的。由于架构在云计算平台之上,因此TipDM克服了传统工具的问题,能够处理TB级的海量数据挖掘,具备了双向扩展、高容错性、易于部署等特点。

TipDM具有并行、多线程处理能力,并能提供优化机制以保障在海量数据和大规模计算时的性能。

 适应不同类型层次人员需求

针对不同用户类型,TipDM推出四个版本(个人版、企业版、嵌入版和教研版),以满足不同应用层次人员的需求。

个人版:在线数据挖掘(www.tipdm.cn, www.tipdm.com.cn),用户不用安装系统,而是通过浏览器直接在线使用,适合有数据挖掘研究需要的单位及个人。利用系统提供的方案管理、数据管理、数据探索、数据预处理、预测建模、模型评价等功能,快速引导用户实现数据挖掘建模,同时结合系统自带的数据挖掘教程及参考案例,通过模板可快速输出用户所需的预测分析报告。

企业版:适合有数据挖掘分析需要的企业,项目框架来源于目前基于云计算和SOA架构的海量数据挖掘平台的B/S版本。即在此平台框架下,保持现有应用框架、核心算法、基本功能模块,仅增加业务功能模块,进行快速二次开发。

嵌入版:适合第三方集成商有数据挖掘应用需要,但本身缺乏这方面的技术资源,在投入较少成本的前提下,利用TipDM提供的各类数据挖掘算法标准接口,快速实现数据挖掘应用的开发。

教研版:主要适合高校、科研院所教学及科学研究,数据挖掘技术近年来越来越受到人们的重视,被认为是21世纪最具有发展前途的领域。因此国内不少高校将此内容引入本科教学中,在自动化、电子信息、金融等专业开设了数据挖掘技术相关的课程。由于条件和学时所限,这些内容的教学主要限于理论介绍,因为抽象,学生理解起来往往比较困难,教学效果不甚理想。基于以上原因,TipDM推出了适合高校教学的数据挖掘辅助教学套件,教学套件包括辅助教学建模软件、辅助教学多媒体软件、辅助教学PPT、辅助教学实训教程。

  • 版权声明:本篇文章(包括图片)来自网络,由程序自动采集,著作权(版权)归原作者所有,如有侵权联系我们删除,联系方式(QQ:452038415)。