横断面研究中的选择偏倚是什么意思?

了解总体参数是横断面研究的一个主要目的,但是研究结果常常会存在系统误差,又称为偏倚(bias),系统误差属于非抽样误差(non-sampling error)。 它不仅存在于概率抽样研究,而且存在于其...
阅读全文

横断面研究(现况研究或现患研究)是什么意思?

一、横断面研究的概念和特点 (一) 概念 横断面研究亦称现况研究或现患研究,是按照预先设计的要求在特定时间、特定范围内应用普查或抽样调查的方法收集某一特定人群中某种疾病或健康信息,描述疾病或健康状态及...
阅读全文

医学统计资料的整理:数据筛选与处理

(一)数据筛选 数据筛选通常包括两方面: 1.纠错或剔除 一般经数据审核中的专业检查、统计检查、逻辑检查和计算机检查等,可以发现数据中的错误,然后通过核对,对错误数据进行纠正,无法纠正者予以剔除。 2...
阅读全文

医学统计资料的整理:数据审核的方法

(一)数据审核的内容 1.完整性 即研究所需的资料是否全部得到,有无缺项、漏项等现象。完整性是保证资料质量的基础,主要检查原始资料有无遗漏或重复,内容是否齐全。 2.真实性 即判断原始资料有无伪造、篡...
阅读全文

医学统计资料的来源有哪些?

一、医学统计资料的来源 1.常规保存记录(routinely kept records) 指医疗卫生机构作为历史档案保存的常规活动记录。常规保存记录提供居民健康状况,医疗卫生机构设施、人员、经费分布,...
阅读全文
假设检验中如何控制两类错误发生的概率? 医学统计学

假设检验中如何控制两类错误发生的概率?

假设检验中如何控制两类错误发生的概率? 答案: 同时控制两类错误,这是难以实现的。主要原因在于第一类错误和第二类错误是一对矛盾,在其他条件不变时,减少犯第一类错误的可能性,势必增加犯第二类错误的可能性...
阅读全文
假设检验中产生两类错误的原因是什么? 医学统计学

假设检验中产生两类错误的原因是什么?

假设检验中产生两类错误的原因是什么? 答案: 产生I类错误的原因主要是样本中含有极端数值或者采用的决策标准过于宽松了。产生II类错误的原因主要是实验设计不灵敏或者样本数据变异性过大或者处理效应本身比较...
阅读全文
误差与测量不确定度的联系区别 数理统计

误差与测量不确定度的联系区别

误差和测量不确定度的联系 测量不确定度是基于误差理论提出、发展的,同时也丰富了误差理论。使用测量不确定度,并不是要取代误差。对于同一被测对象的测量结果,测量不确定度和误差分别从不同的角度来表征,在分析...
阅读全文
什么是标准不确定度?什么是扩展不确定度? 数理统计

什么是标准不确定度?什么是扩展不确定度?

1 标准不确定度 以标准差表示的测量不确定度被称为标准不确定度。 标准不确定度统一规定用小写斜体拉丁字母 u 表示。在实际应用中,如不加说明,标准不确定度可简称为不确定度。 标准差记为 σ ,在实际应...
阅读全文
测量不确定度是什么意思? 概率论

测量不确定度是什么意思?

测量不确定度简称不确定度。其定义为:根据所用到的信息,表征赋予被测量量值分散性的非负参数。 在该定义中,“被测量”是指测量的特定对象;“被测量量值”应理解为被测量的许多量值,不仅包括通过实际测量得到的...
阅读全文

测量不确定度的提出和发展

术语“不确定度”源于英语“Uncertainty”,原意是指可疑或不确定的程度,是一个定性名词。1927年,德国物理学家海森堡指出,在一个量子力学系统中,一个粒子的位置和它的动量不可被同时准确确定,为...
阅读全文

数据仓库中的ODS有什么用途?

数据仓库中的ODS有什么用途 答案: ODS(Operational Data Store)操作性数据,是作为数据库到数据仓库的一种过渡,ODS的数据结构一般与数据来源保持一致,便于减少ETL的工作复...
阅读全文

简要解释数据集市(DM)和数据仓库(DW)的用途

1)DM 请简要解释DM的用途 答案: DM(Data Mart)也称数据集市,为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据,可以认为是一个局部的数据仓...
阅读全文

如何评价特征子集的好坏?如何制定特征选择的停止准则?

如何评价特征子集的好坏 答案: 有比较多的评价函数可以用于评价特征子集的好坏,评价函数主要用来度量一个特征(或者特征子集)可以区分不同类别的能力,使用不同的度量方法最终得到的特征子集也不一样。一个特征...
阅读全文

基于特征选择的数据降维方法有哪些?

特征选择不仅可以减少特征数量、降维,使模型泛化能力更强,减少过拟合,还可以增强对特征和特征值之间的理解。 我们需要区别两个概念,一个是特征选择(feature selection),是指从 n 维空间...
阅读全文

为什么要对数据进行降维?有哪些数据降维方法?

降维是指通过保留一些比较重要的特征,去除一些冗余的特征,减少数据特征的维度。 降维的结果是图像越来越不清晰,最后只剩下轮廓。 在面对海量数据或大数据进行数据挖掘时,通常会面临“维度灾难”,此时需要进行...
阅读全文

以文献内容特征为检索途径的有哪些?

内容特征检索是指文献所记载的知识信息中隐含的、潜在的特征,即与文献记载内容密切相关信息,如分类号、主题词、关键词等,以内容特征为检索提供分类、主题等检索途径,更适合检索未知线索的文献。 (1)分类途径...
阅读全文

以文献外部特征为检索途径的有哪些?

外部特征检索,是指以文献的外部特征,如题名(刊名、书名、篇名)、责任者(如作者、编者、译者、专利权人等)、号码(如专利号、标准号、报告号等)等入手,将其作为检索途径进行文献检索的方法。常包含以下三种途...
阅读全文