快速聚类的基本原理

快速聚类的基本原理 快速聚类分析是聚类分析中使用较广的一种分析方法。它仍以距离衡量样本间的亲疏程度,但其最终结果不是聚成一类,而是根据各聚类中心,将所有样本点聚成指定的类数。 快速聚类法通过设置K个类...
阅读全文

分层聚类法的数据转换方法(马克威系统提供)

分层聚类法的数据转换方法(马克威系统提供) 在实际例子中,经常要对非欧氏距离或者量纲不一样的数据进行聚类分析,所以聚类之前必须先对数据进行标准化处理,否则聚类无法进行。马克威系统提供了以下六种标准化的...
阅读全文

马克威系统提供的五种分层聚类方法

1. 分层聚类的含义 分层聚类是聚类的一种方法。它在聚类分析的开始时,n样本自成一类,然后将性质最接近(距离最近)的两类合并为一类;再从这n-1类中找最近的两类合并,如此反复,直到所有样本聚成一类为止...
阅读全文

简单条形图、分组条形图与分段条形图的区别

简单条形图、分组条形图与分段条形图的区别 条形图(Bar)常用于表示单个变量的变化趋势或多个变量之间的比较。 条形图共有3种图示类型,分别是简单条形图(Simple)、分组条形图(Clustered)...
阅读全文
什么是无意识统计学家法则 数理统计

什么是无意识统计学家法则

什么是无意识统计学家法则(Law of the Unconscious Statistician,LOTUS)。 在概率论与统计学中,如果知道随机变量 X 的概率分布,但是并不显式地知道函数 g ( ...
阅读全文

样本准确性检查与代表性检查的区别

抽样方案设计好之后,便可以组织实施,指导抽样调查的实践。但在实际中,由于情况发生变化,据以设计抽样方案的历史资料或许已经过时,或者因当初考虑不周,在设计时发生失误又未被发现等原因,都可能造成抽样方案的...
阅读全文

抽样调查方案的设计原则

抽样调查方案的设计就是在实际进行抽样调查之前,对整个抽样调查工作过程所做出的通盘考虑和合理安排。在抽样调查方案的设计中,一般应遵循以下两条基本原则: 1.保证抽样的随机性原则。随机原则是抽样调查所必须...
阅读全文

抽样单位数的影响因素

确定抽样单位数,首先决定于调查者对一项抽样推断的可靠程度和精确程度的要求。如果要求抽样的可靠程度和精确程度比较高,那么抽样单位数就要多些;反之,就可以少些。 其次,抽样单位数决定于总体标志的变异程度。...
阅读全文

确定抽样单位数的意义和原则

抽样误差是抽样调查所固有的,虽然不能消除,但却可以控制。影响抽样误差的因素有许多,样本容量的多少是其中最重要的影响因素之一。样本容量越大,样本对总体的代表性就可能愈强,抽样误差就越小,抽样估计的精度也...
阅读全文

区间估计的三要素

区间估计的三要素 参数区间估计:根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围,而不是直接给出总体参数的估计值。 总体参数区间估计应具备...
阅读全文

抽样推断的阶段划分与职业规范

从抽样推断的概念出发,我们可以将抽样调查工作的全过程划分成三个不同的阶段。 第一阶段为抽样设计阶段,即从现象总体中抽选样本的阶段。在这一过程中,要在对现象总体进行初步分析的基础之上编制出尽可能完善的抽...
阅读全文

移动平均趋势剔除法的计算步骤

移动平均趋势剔除法的计算步骤 移动平均趋势剔除法是在考虑长期趋势因素影响的情况下,利用移动平均法先消除原时间数列中的长期趋势的影响,然后再测定季节变动的方法,具体计算步骤如下。 (1)根据时间数列中各...
阅读全文

时间序列加法模型与乘法模型的区别

时间序列中的数据(也称为观测值)总是由各种不同的影响因素共同作用所至,即是说,时间序列中的数据总是包含着不同因素的影响。若以Y代表时间序列中的数据,则Y由上述四类因素所决定的组合模型可以分别由加法模型...
阅读全文
什么是离散系数:统计分析中离散系数的计算公式 数理统计

什么是离散系数:统计分析中离散系数的计算公式

什么是离散系数:统计分析中离散系数的计算公式 当我们比较具有不同水平的数列的变异程度时,一般不能直接用绝对指标,而应该用标志变异的相对指标——离散系数,即标志变异的绝对指标与数列集中趋势值(常常用算术...
阅读全文
什么是k阶矩:k阶矩的计算公式 数理统计

什么是k阶矩:k阶矩的计算公式

矩又叫做动差,是物理学上用以表示力与力臂对重心关系的术语。统计学上常常用矩来测度数据分布的形态。 若以a值为变量x的中点,所有变量值与a之离差的k次方的平均数为变量x关于a的k阶矩: 当a =0时,即...
阅读全文
正态峰度、尖顶峰度与平顶峰度的区别 数理统计

正态峰度、尖顶峰度与平顶峰度的区别

峰态是以正态分布曲线为标准来衡量其尖峭程度的,通常分为正态、尖顶与平顶三种。当频数分布曲线较正态分布曲线更为隆起、更瘦更高的,称为尖顶峰度;反之,分布曲线较正态分配曲线更为平坦、更胖更矮的,称为平顶峰...
阅读全文
测定偏态的方法:由三个四分位数之间的关系来测定 数理统计

测定偏态的方法:由三个四分位数之间的关系来测定

测定偏态的方法:由三个四分位数之间的关系来测定 根据四分位数的性质可知,第一个四分位数Q L 与第二个四分位数Q M (即中位数M e )之间所包括的数据个数,与第二个四分位数Q M 与第三个四分位数...
阅读全文
测定偏态的方法:由均值与众数之间的关系来测定 数理统计

测定偏态的方法:由均值与众数之间的关系来测定

测定偏态的方法:由均值与众数之间的关系来测定 当分布是对称的,均值、中位数、众数是相等的;如果是偏态分布,三者分离。分布越偏,三个数值差距就越大。显然,比较三个集中趋势代表值就成为一种最简单的偏态测度...
阅读全文
测定偏态的方法:由中心矩测定偏态 数理统计

测定偏态的方法:由中心矩测定偏态

测定偏态的方法:由中心矩测定偏态 中心矩实际上是通过高于平均数的离差(正离差)之和与低于平均数的离差(负离差) 之和来度量分布的对称性。当正离差之和与负离差之和相等时,为对称分布;正离差之和与负离差之...
阅读全文

多指标综合评价的意义与局限性

综合评价是多指标综合评价的简称,指在建立评价指标体系的基础上,利用一定的方法,对各个指标做预处理,构建综合评价模型,求得综合评价值,据以对现象总体进行比较、分类和排序的一种统计分析方法。 近年来,综合...
阅读全文