数据一致性分析:什么意思 数据不一致性是指数据的矛盾性、不相容性。直接对不一致的数据进行挖掘,可能会产生与实际相违背的挖掘结果。 在数据挖掘过程中,不一致数据的产生主要发生在数据集成的过程中,这可能是...
离群点分析包括:箱型图分析
离群点分析包括:箱型图分析 异常值是指样本中的个别值,其数值明显偏离其余的观测值。异常值也称为离群点,异常值的分析也称为离群点分析。 箱型图分析 箱型图提供了识别异常值的一个标准:异常值通常被定义为小...
离群点分析包括:3σ原则
离群点分析包括:3σ原则 异常值是指样本中的个别值,其数值明显偏离其余的观测值。异常值也称为离群点,异常值的分析也称为离群点分析。 3σ原则 如果数据服从正态分布,在3σ原则下,异常值被定义为一组测定...
离群点分析包括:简单统计量分析
离群点分析包括:简单统计量分析 异常值是指样本中的个别值,其数值明显偏离其余的观测值。异常值也称为离群点,异常值的分析也称为离群点分析。 简单统计量分析 可以先对变量做一个描述性统计,进而查看哪些数据...
置信区间的优点优势
要评估一项统计研究的结果,不能只看它是否具有统计学显著性。 置信区间把我们对真实p值的了解(以95%的置信度)明白地表示出来。抛1000次和抛4040次硬币所得到的置信区间都包含了0.5这个数字,所以...
显著性检验面临的困难:缺点不足
显著性检验面临的困难:缺点不足 显著性检验的目的,通常是找到总体中存在某种效应的证据。这里说的效应,也许是指抛硬币正面朝上的概率不是一半,或者采用新疗法的癌症病人平均存活时间较长。如果效应够大,就会在...
统计学显著性的意义与作用
统计学显著性的意义与作用 许多统计研究的目的,都是为了证明某种断言是正确的。 临床试验将一种新药和标准用药做比较,因为医生希望新药对病人的帮助更大。研究性别差异的心理学家认为,在一项度量建立人际关系网...
什么是统计学显著性水平:P值区别
什么是统计学显著性水平:P值区别 我们可以事前决定用于否定H 0 的证据必须强到何种程度,也就是说我们想要多小的P值,这个关键的P值就是“显著性水平”(signifcance level),通常用希腊...
举例说明什么是统计学显著性检验
举例说明什么是统计学显著性检验 常常打篮球的一个自以为是的球员声称,他的罚球命中率高达80%。你对他说:“投给我看看。”他投了20个球,结果只投进8个球。“啊哈!”你下结论说,“如果他的命中率真是80...
偏最小二乘回归的主要原理与基本思想
偏最小二乘回归的主要原理与基本思想 偏最小二乘回归:该回归可以用于解决解释变量之间高度相关的问题,其优势是可以用于样本量很少的情形。 它的原理其实跟主成分回归类似,即用被解释变量和解释变量的综合变量来...
岭回归(脊回归)的基本思想与主要原理
岭回归(脊回归)的基本思想与主要原理 岭回归:又称脊回归,由于模型的解与正则化参数λ之间的图像类似于山脊,因此得名。 岭回归作为修正变量完全共线性的方法,其思路为: 既然线性模型在解释变量完全共线的时...
完全共线性:什么意思、影响后果、如何避免
完全共线性:什么意思、影响后果、如何避免 针对解释变量,我们也要对其是否具有完全共线性进行检验。 共线性检验其实可以从相关系数T检验中事先获得一些信息。 比如,在做多元回归分析时发现,如果将每个解释变...
回归分析样本量过小:什么意思、举例说明
回归分析样本量过小:什么意思、举例说明 样本能代表总体吗?是的,无论是假设检验还是回归分析,我们都希望透过样本来发现总体规律。 我们知道,某些临床实验会采用小样本(或者对于一些罕见病来说,只能获得小样...
伪回归问题:什么意思、举例说明
伪回归问题:什么意思、举例说明 “伪回归”中的“伪”指的是虚假相关关系。 我们在衡量两组数据是否有相关关系的时候,无非就是将它们放在一起画一张散点图,计算相关系数,然后得出是否有线性相关关系。 其实我...
回归分析解释变量与随机变量:什么意思
回归分析解释变量与随机变量:什么意思 对于数据而言,要运用回归分析,也是有一定的假设要求的,如下: (1)随机误差项是一个期望值或平均值为0的随机变量。 (2)对于解释变量的所有观测值,随机误差项有相...
运用回归分析的前提、假设要求
运用回归分析的前提、假设要求 对于数据而言,要运用回归分析,也是有一定的假设要求的,如下: (1)随机误差项是一个期望值或平均值为0的随机变量。 (2)对于解释变量的所有观测值,随机误差项有相同的方差...
Wilcoxon符号秩检验的基本思想与主要步骤
Wilcoxon符号秩检验的基本思想与主要步骤 Wilcoxon符号秩检验是1945年Wilcoxon提出的,他的思路是把观测值和原假设所假设的中心位置(或者两组样本数值)之差的绝对值的秩,分别按照不...
非参数统计的适用情况与主要优点
非参数统计的适用情况与主要优点 非参数统计适用于以下几种情况。 (1)等级顺序资料。 (2)偏态资料:当观察资料呈偏态或极度偏态分布而又未经变量变换,或虽经变量变换但仍未达到正态或近似正态分布时。 (...
卡方检验的意义与主要用途
卡方检验的意义与主要用途 卡方检验既可以用来检验两个比率,也可以用来判断多个比率之间是否存在差异。 卡方检验除了可以检验比率差异外,还有其他一些用途: (1)检验某个连续变量的分布是否与某种理论分布相...
方差分析的意义与主要用途
方差分析的意义与主要用途 方差分析主要是用于两样本及以上样本之间的比较,又被称为“变异数分析”或“F检验”。 它有4个主要用途: (1)多样本均值差别的显著性检验。 (2)分离各有关因素并估计其对总变...