数据挖掘 数据挖掘-简单函数变换:什么意思 数据挖掘-简单函数变换:什么意思 简单函数变换是对原始数据进行某些数学函数变换,常用的变换包括平方、开方、取对数、差分运算等,即: 简单的函数变换常用来将不具有正态分布的数据变换成具有正态分布的数据。... 2021年2月20日数据挖掘-简单函数变换:什么意思已关闭评论 阅读全文
数据集成过程中导致数据冗余:如何识别 数据集成过程中导致数据冗余:如何识别 数据集成往往导致数据冗余,例如, 1)同一属性多次出现; 2)同一属性命名不一致导致重复。 仔细整合不同源数据能减少甚至避免数据冗余与不一致,从而提高数据挖掘的速... 2021年2月20日 数据挖掘数据集成过程中导致数据冗余:如何识别已关闭评论 阅读全文
数据集成-实体识别的形式:同名异义、异名同义 数据集成-实体识别的形式:同名异义、异名同义 数据挖掘需要的数据往往分布在不同的数据源中,数据集成就是将多个数据源合并存放在一个一致的数据存储(如数据仓库)中的过程。 实体识别是指从不同数据源识别出现... 2021年2月20日 数据挖掘数据集成-实体识别的形式:同名异义、异名同义已关闭评论 阅读全文
异常值处理方法之一:直接删除的优点缺点 异常值处理方法之一:直接删除的优点缺点 将含有异常值的记录直接删除的方法简单易行,但缺点也很明显,在观测值很少的情况下,这种删除会造成样本量不足,可能会改变变量的原有分布,从而造成分析结果的不准确。视... 2021年2月19日 数据挖掘异常值处理方法之一:直接删除的优点缺点已关闭评论 阅读全文
数据挖掘 python异常值处理的常用方法 python异常值处理的常用方法 在数据预处理时,异常值是否剔除,需视具体情况而定,因为有些异常值可能蕴含着有用的信息。异常值处理常用方法见表1-1。 表1-1 异常值处理常用方法 2021年2月19日python异常值处理的常用方法已关闭评论 阅读全文
拉格朗日插值法与牛顿插值法的区别 拉格朗日插值法与牛顿插值法的区别 牛顿插值法也是多项式插值,但采用了另一种构造插值多项式的方法,与拉格朗日插值相比,具有承袭性和易于变动节点的特点。 从本质上来说,两者给出的结果是一样的(相同次数、相... 2021年2月19日 数据挖掘拉格朗日插值法与牛顿插值法的区别已关闭评论 阅读全文
python处理缺失值的方法:包括删除记录、数据插补 python处理缺失值的方法:包括删除记录、数据插补 处理缺失值的方法可分为3类:删除记录、数据插补和不处理。 如果通过简单的删除小部分记录达到既定的目标,那么删除含有缺失值的记录的方法是最有效的。然... 2021年2月19日 数据挖掘python处理缺失值的方法:包括删除记录、数据插补已关闭评论 阅读全文
什么是判定系数:r2的取值范围 什么是判定系数:r2的取值范围 判定系数是相关系数的平方,用r 2 表示;用来衡量回归方程对y的解释程度。 判定系数取值范围: 0≤r 2 ≤1。 r 2 越接近于1,表明x与y之间的相关性越强; r... 2021年2月19日 数据挖掘什么是判定系数:r2的取值范围已关闭评论 阅读全文
举例说明什么是贡献度分析 举例说明什么是贡献度分析 贡献度分析又称帕累托分析,它的原理是帕累托法则,又称20/80定律。同样的投入放在不同的地方会产生不同的效益。 例如,对一个公司来讲,80%的利润常常来自于20%最畅销的产品... 2021年2月19日 数据挖掘举例说明什么是贡献度分析已关闭评论 阅读全文
什么是时间序列数据挖掘:理论基础与应用方向 什么是时间序列数据挖掘:理论基础与应用方向 时间序列数据挖掘,要从大量的时间序列数据中提取出人们事先不知道的、与时间属性相关的信息,指导中短期的预测。 在金融领域中,时间序列数据是一类重要数据,例如,... 2020年12月21日 数据挖掘什么是时间序列数据挖掘:理论基础与应用方向已关闭评论 阅读全文
什么是分类预测:包括哪些算法 什么是分类预测:包括哪些算法 这是数据挖掘中一个重要的任务,目前的研究在商业领域运用最多,分类的目的是利用带类标签训练数据构造一个分类器,用来描述和区分不同数据的特点和类属,从而对未知分类的数据,根据... 2020年12月21日 数据挖掘什么是分类预测:包括哪些算法已关闭评论 阅读全文
Web挖掘和数据挖掘的区别 Web挖掘和数据挖掘的区别 如果将Web视为客户关系管理的一个新的渠道,那么Web挖掘便可单纯看做数据挖掘应用在网络数据的泛称。利用数据挖掘技术建立更深入的访客数据剖析,并赖以构建精准的预测模型,以实... 2020年12月14日 数据挖掘Web挖掘和数据挖掘的区别已关闭评论 阅读全文
在线分析处理(OLAP)与数据挖掘的关系 在线分析处理(OLAP)与数据挖掘的关系 OLAP(Online Analytical Process)是指由数据库所连结出来的在线查询分析程序。 简单来说,OLAP是由用户所主导,用户先有一些假设,... 2020年12月14日 数据挖掘在线分析处理(OLAP)与数据挖掘的关系已关闭评论 阅读全文
KDD与数据挖掘的关系 KDD与数据挖掘的关系 根据Fayyad等人(1996)对KDD的定义——它是一个指出数据中有效、崭新、潜在效益的非细琐(nontrivial)流程,其最终的目标是了解数据的模式(patterns)。... 2020年12月14日 数据挖掘KDD与数据挖掘的关系已关闭评论 阅读全文
数据挖掘与统计分析的区别 数据挖掘与统计分析的区别 区分数据挖掘和统计分析的差异其实是没有太大意义的。数据挖掘有相当大的比重是由高等统计学中的多元分析所支撑。 但是为什么数据挖掘的出现会引发各领域的广泛关注呢? 主要原因是相较... 2020年12月14日 数据挖掘数据挖掘与统计分析的区别已关闭评论 阅读全文
数据挖掘的基本步骤 数据挖掘的基本步骤 数据挖掘的过程会随所应用的专业领域的不同,而有所变化。 每一种数据挖掘技术都有各自的特性以及使用步骤,因此针对不同问题需求所发展出的数据挖掘过程也存在差异,如数据的完整程度、专业人... 2020年12月14日 数据挖掘数据挖掘的基本步骤已关闭评论 阅读全文
数据挖掘建模的标准:CRISP-DM 数据挖掘建模的标准:CRISP-DM CRISP-DM是Cross-Industry Standard Process for Data Mining的简称,中文翻译为“数据挖掘交叉行业标准过程”。 ... 2020年12月14日 数据挖掘数据挖掘建模的标准:CRISP-DM已关闭评论 阅读全文
数据挖掘工具主要有哪三种 数据挖掘工具主要有哪三种 数据挖掘工具市场大致可分为三类三种: 1)一般分析目的用的软件包 SQL 2008、SAS Enterprise Miner、IBM Intelligent Miner、Un... 2020年12月14日 数据挖掘数据挖掘工具主要有哪三种已关闭评论 阅读全文
什么是孤立点分析(例外挖掘):特点特征、适用情况 什么是孤立点分析(例外挖掘):特点特征、适用情况 数据库中可能包含一些这样的数据对象,它们与集合中其他数据的一般行为或模型不一致,这些数据对象称为孤立点。大部分数据挖掘方法将孤立点视为噪声或例外而丢弃... 2020年11月10日 数据挖掘什么是孤立点分析(例外挖掘):特点特征、适用情况已关闭评论 阅读全文
数据挖掘与机器学习、统计分析的关系 数据挖掘与机器学习、统计分析的关系 数据挖掘利用了人工智能(AI)和统计分析的进步所带来的好处,这两门学科都致力于模式发现和预测。 数据挖掘不是为了替代传统的统计分析技术,相反,它是统计分析方法技术的... 2020年11月10日 数据挖掘数据挖掘与机器学习、统计分析的关系已关闭评论 阅读全文