聚类分析算法评价:RI评价法 数据挖掘

聚类分析算法评价:RI评价法

聚类分析算法评价:RI评价法 聚类分析仅根据样本数据本身将样本分组。其目标是实现组内的对象相互之间是相似的(相关的),而不同组中的对象是不同的(不相关的)。组内的相似性越大,组间差别越大,聚类效果就越...
阅读全文
聚类分析算法评价:purity评价法 数据挖掘

聚类分析算法评价:purity评价法

聚类分析算法评价:purity评价法 聚类分析仅根据样本数据本身将样本分组。其目标是实现组内的对象相互之间是相似的(相关的),而不同组中的对象是不同的(不相关的)。组内的相似性越大,组间差别越大,聚类...
阅读全文

Apriori算法实现的两个过程:连接步与剪枝步

Apriori算法实现的两个过程:连接步与剪枝步 1)找出所有的频繁项集(支持度必须大于等于给定的最小支持度阈值),在这个过程中连接步和剪枝步互相融合,最终得到最大频繁项集L k 。 连接步: 连接步...
阅读全文

Ariori算法的主要思想与算法性质

Ariori算法的主要思想与算法性质 Apriori算法的主要思想是找出存在于事务数据集中的最大的频繁项集,在利用得到的最大频繁项集与预先设定的最小置信度阈值生成强关联规则。 Apriori的性质 频...
阅读全文
什么是频繁项集:项集支持度计数如何计算 数据挖掘

什么是频繁项集:项集支持度计数如何计算

什么是频繁项集:项集支持度计数如何计算 项集 项集是项的集合。包含k个项的项集称为k项集,如集合{牛奶,麦片,糖}是一个3项集。 项集的出现频率是所有包含项集的事务计数,又称作绝对支持度或支持度计数。...
阅读全文

最小支持度和最小置信度:什么意思

最小支持度和最小置信度:什么意思 最小支持度是用户或专家定义的衡量支持度的一个阈值,表示项目集在统计意义上的最低重要性; 最小置信度是用户或专家定义的衡量置信度的一个阈值,表示关联规则的最低可靠性。 ...
阅读全文
关联规则的一般形式 数据挖掘

关联规则的一般形式

关联规则的一般形式 项集A、B同时发生的概率称为关联规则的支持度(也称相对支持度)。 项集A发生,则项集B发生的概率为关联规则的置信度。
阅读全文

p阶差分与k步差分:什么意思

p阶差分与k步差分:什么意思 (1)p阶差分 相距一期的两个序列值之间的减法运算称为1阶差分运算。 (2)k步差分 相距k期的两个序列值之间的减法运算称为k步差分运算。
阅读全文

随机时序分析方法的建立模型

随机时序分析方法的建立模型 随机时序分析法的发展就是为了弥补确定性因素分解方法的不足。 根据时间序列的不同特点,随机时序分析可以建立的模型有ARIMA模型、残差自回归模型、季节模型、异方差模型等。
阅读全文

确定性因素分解方法:什么意思、特点特征

确定性因素分解方法:什么意思、特点特征 确定性因素分解的方法把所有序列的变化都归结为4个因素(长期趋势、季节变动、循环变动和随机波动)的综合影响,其中长期趋势和季节变动的规律性信息通常比较容易提取,而...
阅读全文

非平稳时间序列分析方法:分为确定性因素分解、随机时序分析

非平稳时间序列分析方法:分为确定性因素分解、随机时序分析 实际上,在自然界中绝大部分序列都是非平稳的。因而对非平稳序列的分析更普遍、更重要,创造出来的分析方法也更多。 对非平稳时间序列的分析方法可以分...
阅读全文

纯随机性(白噪声)检验:什么意思、特点特征

纯随机性(白噪声)检验:什么意思、特点特征 如果一个序列是纯随机序列,那么它的序列值之间应该没有任何关系,即满足γ(k)=0,k≠0这是一种理论上才会出现的理想状态,实际上纯随机序列的样本自相关系数不...
阅读全文

自相关图检验:什么意思、特点特征

自相关图检验:什么意思、特点特征 自相关图检验。平稳序列具有短期相关性,这个性质表明对平稳序列而言通常只有近期的序列值对现时值的影响比较明显,间隔越远的过去值对现时值的影响越小。 随着延迟期数k的增加...
阅读全文

时序图检验:什么意思、特点特征

时序图检验:什么意思、特点特征 时序图检验。根据平稳时间序列的均值和方差都为常数的性质,平稳序列的时序图显示该序列值始终在一个常数附近随机波动,而且波动的范围有界; 如果有明显的趋势性或者周期性,那它...
阅读全文

序列的平稳性检验方法:包括时序图、自相关图、单位根检验

时间序列的平稳性检验:包括时序图、自相关图、单位根检验 对序列的平稳性的检验有两种检验方法,一种是根据时序图和自相关图的特征做出判断的图检验,该方法操作简单、应用广泛,缺点是带有主观性; 另一种是构造...
阅读全文

平稳时间序列:什么意思、特点特征

平稳时间序列:什么意思、特点特征 对于随机变量X,可以计算其均值(数学期望)、方差σ 2 ;对于两个随机变量量X和Y,可以计算X,Y的协方差cov(X,Y)=E和相关系数ρ(X,Y)=/(σ X σ ...
阅读全文

时间序列预处理的两种检验:白噪声序列与平稳序列

时间序列预处理的两种检验:白噪声序列与平稳序列 拿到一个观察值序列后,首先要对它的纯随机性和平稳性进行检验,这两个重要的检验称为序列的预处理。根据检验结果可以将序列分为不同的类型,对不同类型的序列会采...
阅读全文
数据挖掘离群点的成因与类型 数据挖掘

数据挖掘离群点的成因与类型

数据挖掘离群点的成因与类型 (1)离群点的成因 离群点的主要成因有:数据来源于不同的类、自然变异、数据测量和收集误差。 (2)离群点的类型 对离群点的大致分类见表1-1。
阅读全文
离群点检测(偏差检测):什么意思、例子案例 数据挖掘

离群点检测(偏差检测):什么意思、例子案例

离群点检测(偏差检测):什么意思、例子案例 就餐饮企业而言,经常会碰到如下问题。 1)如何根据客户的消费记录检测是否为异常刷卡消费? 2)如何检测是否有异常订单? 这一类异常问题可以通过离群点检测来解...
阅读全文

递归特征消除算法的主要思想

递归特征消除算法的主要思想 递归特征消除的主要思想是反复的构建模型(如SVM或者回归模型)然后选出最好的(或者最差的)的特征(可以根据系数来选),把选出来的特征放到一边,然后在剩余的特征上重复这个过程...
阅读全文