类别型数据缺失的处理方法:自动填补法 数据挖掘

类别型数据缺失的处理方法:自动填补法

类别型数据缺失的处理方法:自动填补法 自动填补法。即对同一个属性的所有缺失值用一个事先确定的值来填补,例如都用Unknown来填补。但是,当一个属性的缺失值较多时,该方法会导致数据分析结果不准确。 也...
阅读全文

类别型数据缺失的处理方法:人工填补法

类别型数据缺失的处理方法:人工填补法 人工填补法。即使用人力收集缺失的数据。 例如,当某个会员数据的生日属性有缺失时,可打电话询问该会员,以取得其生日数据并填补。 通常这种方法很费时,因此,当数据集很...
阅读全文

类别型数据缺失的处理方法:直接忽略法

类别型数据缺失的处理方法:直接忽略法 直接忽略法。即当数据有缺失值时,则将整行数据删除。 直接忽略法是处理缺失值最简单的方法,一般,当缺失值占整行所有数据的比例过大时(>50%),便可直接将整行...
阅读全文

什么是缺失值:造成数据缺失的原因

什么是缺失值:造成数据缺失的原因 缺失值是指为空的属性值,造成数据缺失的原因有以下几种: (1)数据未输入。例如工作人员故意或不小心没有输入数据。 (2)设备故障。例如收款机故障,导致顾客消费明细无法...
阅读全文

离群值的检测与处理方法

离群值的检测与处理方法 数值型数据的处理方法也是先观察其分布,即检测离群值。离群值的检测有3种方法。 方法一:当离群值为过大或过小的值时,对数据进行排序即可发现。 方法二:平均值法,在平均值±3×标准...
阅读全文

什么是数据整合:数据整合的例子

什么是数据整合:数据整合的例子 数据整合是将不同来源的数据整合在一个数据库中的过程。因为数据的来源不同,数据可能会出现不一致的情况,包括数据结构不一致、属性名不一致和属性值不一致。例如,不同来源的收入...
阅读全文
KNN(K最近邻)算法:主要思想、例子案例 数据挖掘

KNN(K最近邻)算法:主要思想、例子案例

KNN(K最近邻)算法:主要思想、例子案例 KNN算法的主要思想是将需要分类的数据与训练数据进行对比,在事先指定的范围内,在训练数据中找到与待分类的数据距离最近的训练数据,再根据这些数据的类别,将待分...
阅读全文
数据挖掘模型评估指标:Lift Chart(升力图) 数据挖掘

数据挖掘模型评估指标:Lift Chart(升力图)

数据挖掘模型评估指标:Lift Chart(升力图) Lift Chart(升力图)是在Gain Chart的基础上,保持横轴不变(即依然为营销人数的百分比),而纵轴变为绩效增益。 如图4-9所示,可...
阅读全文
数据挖掘模型评估指标:Gain Chart 数据挖掘

数据挖掘模型评估指标:Gain Chart

数据挖掘模型评估指标:Gain Chart Gain Chart(增益图)主要用来评估模型的好坏。如图4-8所示,其中横轴为营销人数的百分比,纵轴为有回应人数的百分比。 点①表示在向所有客户进行营销的...
阅读全文

数据挖掘的绩效增益

数据挖掘的绩效增益 数据挖掘的绩效增益与营销的绩效增益有着极大的关联性。一般来说,影响营销的绩效有3种因素,即创意、优惠和名单。创意指的是营销活动是否有一个很好的创意,例如,有创意的宣传文字、标题等。...
阅读全文

预测型数据挖掘(有监督数据挖掘)的功能

预测型数据挖掘(有监督数据挖掘)的功能 预测型数据挖掘的功能分为两大类,即分类和预测,主要用于根据数据进行准确预测。 1.分类 分类用于预测数据所隶属的类别,例如,根据贷款客户的各种资料,预测其是否能...
阅读全文
描述型数据挖掘的功能:关联规则、序列模型和聚类分析 数据挖掘

描述型数据挖掘的功能:关联规则、序列模型和聚类分析

描述型数据挖掘的功能:关联规则、序列模型和聚类分析 描述型数据挖掘的功能分为三大类,即关联规则、序列模型和聚类分析,主要用于寻找数据之间的关系。 1.关联规则 关联规则用于找出哪些事件常常会一起出现,...
阅读全文
C5.0算法的剪枝方法 数据挖掘

C5.0算法的剪枝方法

C5.0算法的剪枝方法 如果在训练数据集中存在噪声或者训练数据太少,就会出现过拟合的现象,这时我们需要对决策树模型进行剪枝。 在 C5.0算法中,剪枝的方法为:先建立决策树模型,使得模型分类的准确度达...
阅读全文

ID3算法的优点缺点

ID3算法的优点缺点 ID3算法是一种比较简单的决策树字段选择方法,它的基础理论清晰,但也有一些缺点。 (1)ID3算法在选择根节点和各内部节点中的分支属性时,采用信息增益作为评价标准。信息增益的缺点...
阅读全文
举例说明决策树与决策规则之间的关系 数据挖掘

举例说明决策树与决策规则之间的关系

决策树与决策规则之间的关系 直接法和间接法看似相同,实则不同,因为决策树模型不一定等同于决策规则,二者之间有一些差别。下面通过一个例子介绍决策树与决策规则之间的关系。 图9-12所示的为根据观看球赛的...
阅读全文

决策树的分类:直接法与间接法

决策树的分类:直接法与间接法 使用决策树进行分类有两种方法,即直接法和间接法。 (1)直接法:使用决策树对实例进行分类时,从树根开始,顺着分支向下走,直至到达某个叶节点,该叶节点即为该对象的分类。 (...
阅读全文