商务智能(BI)与报表系统的区别

商务智能(BI)与报表系统的区别 传统的报表系统和BI存在着本质的区别。传统的业务报表系统一般被设计成扁平系统,主要是针对分离的事务处理,但对结构化的分析和统计却无能为力。一个独立的BI系统,能够从各...
阅读全文

商务智能的产生和发展过程

商务智能的产生和发展过程 商务智能是随着Internet的高速发展和企业信息化的不断深入而产生的。其发展也是一个渐进的、复杂的演变过程,而且目前仍然处于发展之中。它经历了事务处理系统(Transact...
阅读全文

商务智能(BI)的功能

商务智能具有以下4项功能。 (1)数据管理功能:从多个数据源中抽取、转换、装载(ETL)数据、清洗数据、数据集成的能力;大量数据高效存储与维护的能力。 (2)数据分析功能:具备OLAP、Legacy等...
阅读全文

商务智能(BI)的过程

商务智能的过程是:首先需要准备正确可用的数据,其次要将这些数据转化为有价值的信息,再用于指导商业实践(智慧)。该过程就包括了数据抽取、分析和挖掘 3 个主要环节,分别由DW、OLAP、DM技术来完成。...
阅读全文

数据挖掘的过程:SAS公司的SEMMA方法论

数据挖掘的过程:SAS公司的SEMMA方法论 针对数据挖掘过程中直接与数据相关的部分,SAS公司提出了SEMMA方法论,将数据挖掘的核心过程分为抽样(Sample)、探索(Explore)、修整(Mo...
阅读全文

CRISP-DM模型的六个阶段

CRISP-DM模型的六个阶段 CRISP-DM(CRoss-Industry Standard Process for Data Mining,数据挖掘的跨行业标准过程)是由Daimler Chry...
阅读全文

数据挖掘银行业应用案例:企业贷款信用风险

数据挖掘银行业应用案例:企业贷款信用风险 在给企业贷款时,银行不可避免地面临着信用风险,这种风险可以通过两类指标来刻画:一是企业贷款违约的概率,二是一旦企业违约所带来的损失。如果能够很好地预测信用风险...
阅读全文

基于云计算的海量数据挖掘技术特点(Hadoop框架)

基于云计算的海量数据挖掘技术特点(Hadoop框架) 云计算是一种资源利用模式,它能以简便的途径和按需的方式通过网络访问可配置的计算资源,快速部署资源。在这种模式中,应用、数据和资源以服务的方式通过网...
阅读全文

WEKA数据挖掘的包结构

WEKA数据挖掘的包结构 通常,每个Java程序都是作为一个类来实现的,当程序比较大时,可能被分割为几个类,而当类的数量很多时,就很难理解和查找。于是,Java就允许将许多类组织在一起组成一个包,每个...
阅读全文

WEKA数据挖掘的功能及其算法

WEKA是一个完全开放的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,如对数据进行预处理、分类预测、聚类分析、关联规则挖掘、属性选择等。 在数据挖掘建模过程中,包括准备要输入的数据,进...
阅读全文

数据挖掘平台(TipDM)的产品特点

数据挖掘平台(TipDM)的产品特点 广州TipDM团队一直致力于基于云计算的海量数据挖掘,借鉴WEKA、MATLAB、R和Mahout的优点,基于Hadoop并行计算平台,采用MapReduce计算...
阅读全文

数据挖掘平台(TipDM)的产品功能

数据挖掘平台(TipDM)的产品功能 TipDM以智能预测技术为核心,并提供开放的应用接口。TipDM的底层算法,主要基于MATLAB、R、WEKA、Mahout等通过封装形成,所以建模输出结果与这几...
阅读全文

几种常用的数据挖掘建模工具

下面简单介绍几种常用的数据挖掘建模工具: 1.Enterprise Miner Enterprise Miner(简称EM)是SAS推出的一个集成的数据挖掘系统,允许使用和比较不同的技术,同时还集成了...
阅读全文

什么是分类与回归:分类与回归建模的原理

什么是分类与回归:分类与回归建模的原理 分类(Classification):指将数据映射到预先定义好的群组或类。 因为在分析测试数据之前,类别就已经确定了,所以分类通常被称为有监督的学习。分类算法要...
阅读全文

什么是聚类分析:聚类分析建模的原理

什么是聚类分析:聚类分析建模的原理 聚类(Clustering)分析:是在没有给定划分类的情况下,根据信息相似度进行信息聚类的一种方法,因此聚类又称为无指导的学习。 与分类不同,分类需要先定义类别和训...
阅读全文

什么是关联规则:关联规则的内涵

什么是关联规则:关联规则的内涵 关联规则(Association):揭示数据之间的相互关系,而这种关系没有在数据中直接表示出来。 关联分析的任务就是发现事物间的关联规则或称相关程度。关联规则的一般形式...
阅读全文

时间序列的组合成分:四个因素

时间序列的组合成分:四个因素 时间序列的变化主要受到长期趋势、季节变动、周期变动和不规则变动这四个因素的影响。其中: 长期趋势因素(T)反映了经济现象在一个较长时间内的发展方向,它可以在一个相当长的时...
阅读全文

什么是时序模式:时序模式的内涵

什么是时序模式:时序模式的内涵 时序模式:描述基于时间或其他序列的经常发生的规律或趋势,并对其建模。 与回归一样,它也用已知的数据预测未来的值,但这些数据的区别是变量所处时间的不同。序列模式将关联模式...
阅读全文

数据挖掘现状及应用前景

数据挖掘现状及应用前景 “数据海量,信息缺乏”是大多数金融企业所面对的尴尬。目前,金融业实施的大多数数据库只能实现数据的录入、查询、统计等较低层次的功能,却无法发现数据中存在的各种有用信息,例如对这些...
阅读全文

什么是商业智能(BI):商业智能的内涵

什么是商业智能(BI):商业智能的内涵 BI(Business Intelligence,商业智能)是一种运用了数据仓库、在线分析和数据挖掘等技术来处理和分析数据的崭新技术,目的是为企业决策者提供决策...
阅读全文