举例说明什么是样本聚类算法 数据分析

举例说明什么是样本聚类算法

举例说明什么是样本聚类算法 根据个体之间的相似性对个体进行分类,即样本聚类算法。这种算法被大量使用在客户细分场景中。如图1-1所示,根据信用卡客户6个月内的循环信用次数和交易次数,将客户分为6个细分群...
阅读全文

操作层面的数据分析对象与成果

数据分析是为达到业务目标而进行的一系列有目的、有步骤的操作。 (1)数据 数据是客观事物属性的取值,是信息的具体描述和表现,是信息的载体。在计算机系统中,凡能被计算机所接收和处理的字符、数字、图形、图...
阅读全文
概率分布函数与概率密度函数的区别 概率论

概率分布函数与概率密度函数的区别

大数定律决定试验多次后平均值的极限,但并未涉及事件频率(或者概率)的分布问题。随机变量取值概率形成的分布称为概率分布。概率分布函数在概率论中有其严格的定义,这里我们首先从通俗意义上理解一下“分布”。 ...
阅读全文
高尔顿钉板试验的意义 概率论

高尔顿钉板试验的意义

弗朗西斯•高尔顿(Sir Francis Galton, 1822—1911)是英国著名的统计学家、心理学家和遗传学家。他是达尔文的表弟,虽然不像达尔文那样声名显赫,但也不是无名之辈。并且,高尔顿幼年...
阅读全文

全概率公式与贝叶斯公式的区别

全概率公式与贝叶斯公式的区别 当计算一个较复杂事件的概率时,我们往往将其分解为一些互不相容的简单事件之并,然后分别计算这些简单事件的概率,再利用概率的加法定理和乘法公式加以解决。该方法的一般化就产生了...
阅读全文
什么是全概率公式 概率论

什么是全概率公式

当计算一个较复杂事件的概率时,我们往往将其分解为一些互不相容的简单事件之并,然后分别计算这些简单事件的概率,再利用概率的加法定理和乘法公式加以解决。该方法的一般化就产生了全概率公式。 定义1.1 在随...
阅读全文

机器学习、人工智能与数据挖掘的关系

机器学习是人工智能的一个分支,作为人工智能的核心技术和实现手段,通过机器学习的方法解决人工智能面对的问题。机器学习是通过一些让计算机可以自动“学习”的算法,从数据中分析获得规律,然后利用规律对新样本进...
阅读全文
概率的乘法公式(或乘法定理) 概率论

概率的乘法公式(或乘法定理)

利用条件概率公式,我们即可得到下列概率的乘法公式(或乘法定理)。 定理1.1(乘法公式) 对于任意两个事件 A 、 B ,若 P ( B )>0,则 P ( AB )= P ( B ) P ( A |...
阅读全文
概率的运算法则:多个事件的加法定理 概率论

概率的运算法则:多个事件的加法定理

概率的运算法则:多个事件的加法定理 定理1.1(多个事件的加法定理) 对于任意三个事件 A 、 B 、 C ,有 P ( A ∪ B ∪ C )= P ( A )+ P ( B )+ P ( C )-...
阅读全文
概率的运算法则:事件之差公式 概率论

概率的运算法则:事件之差公式

概率的运算法则:事件之差公式 定理1.1(事件之差公式) 对任意事件 A 、 B ,有 P ( A - B )= P ( A )- Pl ( AB ) 特别地,当 B ⊂A时,有 P ( A - B ...
阅读全文
概率的运算法则:互不相容事件加法定理 概率论

概率的运算法则:互不相容事件加法定理

概率的运算法则:互不相容事件加法定理 定理1.1(互不相容事件加法定理) 如果事件 A 与 B 互不相容,即 AB =∅,则 P ( A ∪ B )= P ( A )+ P ( B ) 更一般地,对于...
阅读全文
概率的公理化定义 概率论

概率的公理化定义

由于古典概率、几何概率只适用于等可能的情形,而统计概率则要求做大量的重复试验后才能得到较准确的概率近似值,且在数学上不够严谨。为了克服这些定义的局限性,同时受这些定义的性质的启示,1933年,苏联数学...
阅读全文
什么是评价者信度 管理统计学

什么是评价者信度

在有些测量情形中,评价者的评判也是误差的来源之一,如投射测验、无领导小组讨论、评价中心技术等,都依赖于评价者的判断。这种判断的主观性往往会造成不同评价者的评分不一致,因此有必要考虑评价者信度。 评价者...
阅读全文

分半信度与同质性信度的区别

重测信度和复本信度分别注重考查测量的跨时间的一致性和跨形式的一致性,而内部一致性信度主要反映的是测验内部题目之间的关系,考查测验的各题目是否测量了相同的内容或特质。内部一致性信度又分为分半信度和同质性...
阅读全文

复本信度(等值性系数)的优点缺点

复本信度又称等值性系数,是以两个测验复本(功能等值但题目内容不同)测量同一个群体,然后求得应试者在这两个测验上得分的相关系数。复本信度的高低反映了这两个测验复本在内容上的等值性程度。两个等值的测验互为...
阅读全文

什么是重测信度(稳定性系数)

重测信度又称稳定性系数,它的计量方法是采用重测法,即用同一测量工具,在不同时间对同一群体施测两次,两次测量的分数的相关系数即重测系数。根据重测系数的高低,可以得知测量结果在经过一段时间之后的稳定程度。...
阅读全文
什么是信度系数:信度系数的作用 管理统计学

什么是信度系数:信度系数的作用

信度高低的指标称为信度系数(Reliability Coefficient),通常以相关系数表示。信度系数一般是同一样本所得的两组资料的相关,在理论上表示为实得分数与真实分数相关的平方: 式中, r ...
阅读全文

Stata软件实现随机效应模型的命令:xtreg命令

Stata软件实现随机效应模型的命令:xtreg命令 随机效应模型的核心在于其假定模型中不随时间变化的非观测效应与误差项相关,在这种假设下,GLS处理方法便可得到更高的效率。与固定效应模型一样,Sta...
阅读全文

Stata软件实现固定效应模型的命令:xtreg命令

Stata软件实现固定效应模型的命令:xtreg命令 固定效应模型是处理面板数据常用的模型,固定效应的模型原理是用每一期的数据减去各期数据的均值,消去不随时间变化的非观测效应α i 。固定效应模型在S...
阅读全文