数据挖掘 数据挖掘方法论:CRISP-DM 数据挖掘方法论:CRISP-DM CRISP-DM,Cross Industry Standard Process of Data Mining,被称为跨产业的数据挖掘标准流程,即无论什么产业,其数据... 2020年10月25日数据挖掘方法论:CRISP-DM已关闭评论 阅读全文
数据挖掘方法论:SEMMA 数据挖掘方法论:SEMMA SEMMA表示Sample,Explore,Modify,Model和Assess。 SEMMA是由 SAS Institute开发的连续步骤清单。SAS Institut... 2020年10月25日 数据挖掘数据挖掘方法论:SEMMA已关闭评论 阅读全文
Weka软件使用环境简介 Weka软件使用环境简介 Weka是由新西兰怀卡托大学开发的智能分析软件。它的工作平台汇集了机器学习算法及数据预处理工具。Weka是由Java语言开发而成的,在GNU通用公共许可证的条款下进行发布,几... 2020年10月25日 SpssWeka软件使用环境简介已关闭评论 阅读全文
Spss IBM SPSS Modeler:使用教程、相关节点 IBM SPSS Modeler:使用简介、相关节点 IBM SPSS Modeler(以下简称SPSS Modeler)是一组数据挖掘工具,通过它可以快速建立预测模型,并将其应用于商业活动中,从而改... 2020年10月25日IBM SPSS Modeler:使用教程、相关节点已关闭评论 阅读全文
数据挖掘的发展历程 数据挖掘的发展历程 数据挖掘虽然是计算机应用领域的新名词,但也经历了几十年的发展历程。 ●第一阶段:1960年以后,各种新兴的数据收集模式开始出现,例如磁带、软盘、硬盘等,人们开始掌握了收集数据的基本... 2020年10月24日 数据挖掘数据挖掘的发展历程已关闭评论 阅读全文
平稳序列和非平稳序列 平稳序列和非平稳序列 时间序列中某一时间t i 上的观测值y i ,可以分解为四个构成部分:长期趋势,记作T ti ;季节波动,记作S ti ;循环波动,记作C ti ;随机波动,记作I ti 。 一... 2020年10月24日 统计学平稳序列和非平稳序列已关闭评论 阅读全文
什么是数据分析师 什么是数据分析师 数据分析师是一个随着大数据兴起而崛起的新兴的工作岗位,是专门从事行业数据搜集、整理、分析,并依据数据制作业务报告、提供决策、管理数据资产、评估和预测的专业人员。 很多人并不知道数据分... 2020年10月15日 数据分析什么是数据分析师已关闭评论 阅读全文
实现数据可视化的意义与作用 实现数据可视化的意义与作用 在当今的移动互联网时代,企业数据量猛增,数据背后隐藏的信息和价值显得越来越重要。因此,企业都希望通过数据可视化进行快速分析。 数据可视化的作用如下: ● 数据可视化可以帮助... 2020年10月11日 数据可视化实现数据可视化的意义与作用已关闭评论 阅读全文
什么是数据可视化:数据可视化的特点与步骤 什么是数据可视化:数据可视化的特点与步骤 数据可视化是一种数据的视觉表现形式,是指以某种概要形式抽提出来的信息及相应信息单位的各种属性和变量。简单来说,是指数据以视觉形式来呈现,如图表或地图等,可以用... 2020年10月11日 数据可视化什么是数据可视化:数据可视化的特点与步骤已关闭评论 阅读全文
什么是数值归约(数据削减):数值归约的处理方法 什么是数值归约:数值归约的方法 数值归约是指用较简单的数据表示形式替换原数据,或者采用较小的数据单位,或者用数据模型代替数据以减少数据量。常用的方法有直方图、用聚类数据表示实际数据、抽样和参数回归法等... 2020年10月11日 大数据什么是数值归约(数据削减):数值归约的处理方法已关闭评论 阅读全文
什么是维归约:维归约的处理方法 什么是维归约:维归约的处理方法 数据归约,也叫数据削减,是指在尽可能保持数据原貌的前提下,最大限度地精简数据量。 维归约是从原有的数据中删除不重要或不相关的属性,或者通过对属性进行重组来减少属性的个数... 2020年10月11日 大数据什么是维归约:维归约的处理方法已关闭评论 阅读全文
什么是冗余数据:冗余数据的处理方法 什么是冗余数据:冗余数据的处理方法 冗余数据既包括重复的数据,也包括对分析处理的问题无关的数据,通常采用过滤数据的方法来处理冗余数据。对于重复的数据采用重复过滤的方法,对于无关的数据则采用条件过滤的方... 2020年10月11日 大数据什么是冗余数据:冗余数据的处理方法已关闭评论 阅读全文
什么是噪声数据:噪声数据的处理方法 什么是噪声数据:噪声数据的处理方法 噪声数据是指在测量一个变量时测量值可能出现的相对于真实值的偏差或错误,这种数据会影响后续分析操作的正确性与效果。噪声数据主要包括错误数据、假数据和异常数据。异常数据... 2020年10月11日 大数据什么是噪声数据:噪声数据的处理方法已关闭评论 阅读全文
什么是残缺数据:残缺数据的处理方法 什么是残缺数据:残缺数据的处理方法 残缺数据,顾名思义,就是指不完整的数据,如前文所提,残缺数据的情况可能是整个数据的缺失,也可能是数据中某个字段信息的缺失。可根据前文提到的数据质量评估标准中的“完整... 2020年10月11日 大数据什么是残缺数据:残缺数据的处理方法已关闭评论 阅读全文
数据质量的影响因素 数据质量的影响因素 原始数据的数据质量不一,那么究竟有哪些因素会影响数据的质量呢? ● 信息因素:元数据对数据的描述及理解错误、数据源规格不统一等。 ● 技术因素:指由于具体技术处理的异常造成的数据质... 2020年10月11日 大数据数据质量的影响因素已关闭评论 阅读全文
数据质量的评估标准:完整性、一致性、准确性、及时性 数据质量的评估标准:完整性、一致性、准确性、及时性 数据质量是保证数据应用的基础,采集来的原始数据可能存在质量问题,需要通过一定的标准来对数据进行评估。对于未通过评估的数据,将采取一系列的后续方法进行... 2020年10月11日 大数据数据质量的评估标准:完整性、一致性、准确性、及时性已关闭评论 阅读全文
数据采集的方法:系统日志与数据库采集 数据采集的方法:系统日志与数据库采集 通过RFID射频、传感器、社交网络、移动互联网等方式可以获得各种类型的数据,包括结构化、半结构化及非结构化的数据。由于这些数据具有数据量大、异构等特点,因此,必须... 2020年10月11日 大数据数据采集的方法:系统日志与数据库采集已关闭评论 阅读全文
数据挖掘 K-Means算法:算法原理、流程步骤 K-Means算法:算法原理、流程步骤 K-Means算法是一个经典的聚类算法,它接受输入参数k,然后将n个数据对象划分为k个聚类,使所获得的聚类满足以下两个条件。 1)同一聚类中的对象之间的相似度较... 2020年10月11日K-Means算法:算法原理、流程步骤已关闭评论 阅读全文
数据挖掘 数据挖掘的过程与流程 数据挖掘的过程与流程 数据挖掘(Data Mining)是数据库知识发现(Knowledge Discovery From Database,KDD)中的一个重要步骤。数据挖掘一般是指从大量的数据中通... 2020年10月11日数据挖掘的过程与流程已关闭评论 阅读全文
数据挖掘的分类 数据挖掘的分类 数据挖掘涉及多个学科方向,主要包括数据库、统计学和机器学习等。 数据库技术经过20世纪80年代的大发展,除关系数据库外,又陆续出现了面向对象数据库、多媒体数据库、分布式数据库及Web数... 2020年10月11日 数据挖掘数据挖掘的分类已关闭评论 阅读全文