什么是主数据管理(MDM):主数据筛选的标准

主数据管理(Main Data Management,MDM)要做的就是从各部门的多个业务系统中整合最核心的、最需要共享的数据(主数据),集中进行数据的集成和管理,并且以服务的方式把统一的、完整的、准...
阅读全文
什么是数据的全量度与实现应用的速度 大数据

什么是数据的全量度与实现应用的速度

可以肯定地说,现在人们对互联网和移动互联网的发展速度都十分惊讶,甚至都觉得不可思议。所以说在这个信息技术同社会经济、生产生活紧密融合的时代,比的不仅仅是谁更聪明,也比谁更快,谁覆盖的更广,谁更有执行力...
阅读全文
什么是市场接受数据的颗粒度与敏感度 大数据

什么是市场接受数据的颗粒度与敏感度

颗粒度指的就是粗糙度,粗糙就是颗粒度大,精细就是颗粒度小。如果很粗糙的数据也有人埋单,就意味着对数据的敏感度弱。比如中国的教育,只要说出对孩子有帮助,就会有大量的消费人群,这就是标准的颗粒度大、敏感度...
阅读全文
什么是数据的投资收益度及公益度 大数据

什么是数据的投资收益度及公益度

如果投资收益好,企业积极性就高,如果公益性好,政府扶持力度就大,二者如能结合则最佳。数据创新是逐利性和公益性并存的,其逐利性不仅表现在经济利益上,也表现在社会认可上。没有好处和回报,谁都不会求变。 公...
阅读全文

什么是数据的基础约束度

基础约束是指体制、机制、政策、资本等约束,常常是能否实施的关键。 数据兼具主动流动性和被动流动性。主动流动性,比如基因数据的传承,是不以个人的意愿改变而改变的。被动流动性是指外界的强力干扰,比如各个行...
阅读全文

什么是数据的价值密度

产业链上单位时间内创造的产值往往决定能否承受信息数据化初期的成本和风险,产值越大,密度就越高,数据创新所承担的风险度也就越高,成功的可能性就相对较大。这就是价值密度。 例如,金融证券等行业,在很短的时...
阅读全文

什么是数据生产要素理论

在大数据时代,数据的实质正在发生根本性的改变,数据已经从记录过程的依据发展成为生产要素。原有的生产要素大致分为:能源、矿产、土地及其他自然资源,劳动力,资本(诸如货币或货币等价物等)三大类。在过去某一...
阅读全文

一手数据与二手数据的区别

按照来源的不同,数据分为一手数据和二手数据两种: · 一手数据是通过查找或购买无法获取的,只能通过亲自调研获取,相应的采集方法是实地调查。 · 二手数据是别人已经整理出来的,只要查找或购买就能获取,相...
阅读全文

数据的时效性、分散性、概率性、再创性

这里所说的数据,仅指应用于企业运营的市场信息。它是认识事物的中间环节,是事物的表面特征,其作用在于消除事物的不确定性。它具有以下四个基本特征。 1 时效性 所谓时效性是指数据的发生和运用要有个提前期,...
阅读全文
因子分析的四个基本步骤 数据分析

因子分析的四个基本步骤

因子分析的核心问题有两个:一是如何构造因子变量;二是如何对因子变量进行命名解释。因此,因子分析的基本步骤和解决思路就是围绕这两个核心问题展开的。 因子分析通常包括以下四个基本步骤。 1. 确定原有变量...
阅读全文

因子分析的基本思路

因子分析(Factor analysis)是主成分分析的推广和发展,它也是多元统计分析中降维的一种方法。因子分析的形成和早期发展一般认为是从查尔斯·斯皮尔曼(Charles Spearman)在190...
阅读全文

因子分析与主成分分析的区别

因子分析(Factor analysis)是主成分分析的推广和发展,它也是多元统计分析中降维的一种方法。因子分析的形成和早期发展一般认为是从查尔斯·斯皮尔曼(Charles Spearman)在190...
阅读全文

什么是模糊聚类:模糊聚类的应用实例

1. 模糊聚类的含义 将模糊集概念用到聚类分析中便产生了模糊聚类分析,它根据研究对象本身的属性来构造模糊矩阵,在此基础上根据一定的隶属度来确定其分类关系。利用模糊集理论来处理分类问题,它对经济领域中具...
阅读全文

如何处理聚类中的数据噪声和异常值

K-Means算法对噪声和异常值非常敏感,这些个别数据对于平均值的影响非常大,相对而言,K-中心点的方法不像K-Means算法,它不是求样本的平均值,而是用类中最接近于中心点的对象来代表类,因此K-中...
阅读全文

凝聚层次聚类与分裂层次聚类的区别

凝聚层次聚类与分裂层次聚类的区别 在给定n个对象的数据集后,可用层次方法(Hierarchical Methods)对数据集进行层次分解,直到满足某种收敛条件为止。按照层次分解的形式不同,层次方法又可...
阅读全文

统计分析与数据挖掘的主要区别

统计分析与数据挖掘有什么区别呢?从实践应用和商业实战的角度来看,这个问题并没有很大的意义,正如“不管白猫还是黑猫,抓住老鼠才是好猫”一样,在企业的商业实战中,数据分析师分析问题、解决问题时,首先考虑的...
阅读全文

数据挖掘的发展历史

数据挖掘的发展历史 数据挖掘起始于20世纪下半叶,是在当时多个学科发展的基础上发展起来的。随着数据库技术的发展应用,数据的积累不断膨胀,导致简单的查询和统计已经无法满足企业的商业需求,急需一些革命性的...
阅读全文

数据化运营的主要内容

数据化运营,首先是要有企业全员参与意识,要达成这种全员的数据参与意识比单纯地执行数据挖掘技术显然是要困难得多,也重要得多的。只有在达成企业全员的自觉参与意识后,才可能将其转化为企业全体员工的自觉行动,...
阅读全文
举例说明什么是关联规则算法 数据分析

举例说明什么是关联规则算法

根据客户对商品的购买发现商品之间的相关性。 例如关联规则,这类分析方法可以方便地展现产品与产品之间的相关关系。 “啤酒与尿布”是最著名的使用关联规则的案例之一。 零售超市通过分析客户购买清单发现,啤酒...
阅读全文
举例说明什么是样本聚类算法 数据分析

举例说明什么是样本聚类算法

举例说明什么是样本聚类算法 根据个体之间的相似性对个体进行分类,即样本聚类算法。这种算法被大量使用在客户细分场景中。如图1-1所示,根据信用卡客户6个月内的循环信用次数和交易次数,将客户分为6个细分群...
阅读全文