admin发表的所有文章 - 统计学之家

什么是Web文本挖掘？

什么是Web文本挖掘？

以Web文本为分析对象的文本挖掘被称为Web文本挖掘。Web文本挖掘主要通过应用数据挖掘技术从Web页面的文本内容中发现有价值的信息，帮助人们从大量的Web文本数据中找出隐藏的、潜在的关联模式。Web...

2024年4月2日已关闭评论

什么是节点链接法、邻接矩阵法、混合布局法？

图可视化是指将图数据通过计算机图形学和图像处理技术，转化成图形或图像，完成信息展示、交互等功能。图可视化作为信息可视化的子领域，通过展示元素、关系，帮助用户获取数据的洞悉能力，已被广泛地应用在流程图、...

2024年4月2日数据可视化已关闭评论

数据治理的目标与原则

（1）数据治理的目标。加强数据治理是提升企业信息化水平、管理精细化水平，提高企业业务运作效率，增强企业决策能力和核心竞争力的重要途径。数据治理指导其他数据相关活动的开展，是在更高层次上执行数据管理制...

2024年4月2日大数据已关闭评论

什么是系统随机抽样？

虽然简单随机抽样是概率抽样的最基本方法，但它也存在很多局限，比如简单随机抽样需要将总体全部进行编号，当总体体量大时会增加工作量。而且市场调查的样本量一般至少为几百个，即使总体编号不是问题，但用抽签法或...

2024年3月25日应用统计学已关闭评论

Series对象或DataFrame对象使用rank()函数进行排名

根据条件对Series对象或DataFrame对象的值排序（Sorting）和排名（Ranking）是Pandas一种重要的内置运算。Series对象或DataFrame对象可以使用sort_inde...

2024年3月22日 PYTHON已关闭评论

Series对象或DataFrame对象使用sort_index()函数进行排序

根据条件对Series对象或DataFrame对象的值排序（Sorting）和排名（Ranking）是Pandas一种重要的内置运算。Series对象或DataFrame对象可以使用sort_inde...

2024年3月22日 PYTHON已关闭评论

NumPy间接排序argsort()和lexsort()的使用方法

NumPy的排序有直接排序和间接排序。直接排序是对数据直接进行排序，间接排序是指根据一个或多个键值对对数据进行排序。直接排序使用sort()，间接排序使用argsort()和lexsort()。 ar...

2024年3月22日 PYTHON已关闭评论

NumPy直接排序sort()的使用方法

NumPy的排序有直接排序和间接排序。直接排序是对数据直接进行排序，间接排序是指根据一个或多个键值对对数据进行排序。直接排序使用sort()，间接排序使用argsort()和lexsort()。 so...

2024年3月21日 PYTHON已关闭评论

NumPy库中的矩阵对象：matrix

NumPy库中的矩阵对象为matrix，可实现对矩阵数据的处理、矩阵运算以及基本的统计运算，还可实现对复数的处理。 np.matrix(data,dtype,copy)：返回一个矩阵，其中参数data...

2024年3月21日 PYTHON已关闭评论

NumPy数组的形状操作

1.数组的形状数组的形状取决于其每个轴上的元素个数。 >>> a=np.int32(100*np.random.random((3,4))) #生成3×4整数数组 >>...

2024年3月21日 PYTHON已关闭评论

数据清洗、特征工程的重要性

数据是分析的基础。无论是进行数据统计分析、机器学习项目的数据挖掘与建模，还是实现数据可视化，都离不开数据。特征是所有机器学习项目中必不可少的组成部分，是机器学习项目的基础。当给定数据和特征时，数据统计...

2024年3月21日数据科学已关闭评论

数据清洗和特征工程的关系是什么？有什么区别？

数据清洗和特征工程的关系是什么？有什么区别？数据清洗是独立于特征工程的：一方面，数据清洗不仅适用于机器学习项目，也适用于一般的数据统计分析过程，而特征工程仅适用于机器学习项目；另一方面，针对机器学习...

2024年3月21日数据科学已关闭评论

线性回归中的多重共线性

线性回归中的多重共线性

多重共线性是指模型中的自变量之间存在较高的相关关系，如自变量 x 1 , x 2 之间的关系为 x 1 =2 x 2 。多重共线性的存在会影响模型的准确性及稳定性，方差膨胀因子（vif）可以用于检验自...

2024年3月21日已关闭评论

自变量为分类变量的处理：什么是哑变量？

线性回归建模速度快，不需要很复杂的计算，在数据量大的情况下依然能够快速运行，可以根据系数给出每个变量的解释，但不能很好地拟合非线性数据，所以在构建回归模型时需要先判断自变量的类型。分类变量（也称为因...

2024年3月21日 R已关闭评论

Eviews软件视图工具和冻结工具的区别

1）视图工具（View）利用视图工具可以改变对象的呈现方式。如图5.8所示，打开“grade”序列，在序列窗口中单击菜单“View/SpreadSheet”，观测值将以表格显示；单击总菜单“View...

2024年3月20日 Eviews已关闭评论

什么是Eviews软件的对象？

什么是对象？对象是Eviews的基本操作单元，存储了与特定分析有关的一系列信息。有的对象存储的信息类型单一，例如，序列（Series）、矩阵（Matrix）、向量（Vector）对象存储数值信息。有...

2024年3月20日 Eviews已关闭评论

什么是Eviews软件的序列？

什么是序列？序列是单个变量的观测值的集合。序列只能存储数值，不能存储文本。数值既包括定量变量的观测值，也包括定性变量的数值代码。如果定性变量的观测值是文本，Eviews会将其识别为文本序列；如果定...

2024年3月20日 Eviews已关闭评论

如何免费获取Eviews 12学生版？

Eviews是一个商业付费软件。为了方便用户学习和使用，Eviews提供了免费的Eviews 12学生版（Student Version Lite）。首先，访问Eviews官网的申请页面，填写个人信...

2024年3月20日 Eviews已关闭评论

Eviews软件的优点优势和学习资源

1　Eviews的发展历程定量微软（Quantitative Micro Software，QMS）公司在1994年发布了Eviews 1，其前身是世界上第一个基于个人计算机的时间序列分析软件（Ti...

2024年3月20日 Eviews已关闭评论

生活中的统计学：巧克力吃得越多，得诺贝尔奖概率越大

2012年10月11日，美国联合通讯社（The Associated Press，简称“美联社”）报道，某杂志刊文称，一个国家的人均巧克力消费量和这个国家得诺贝尔奖的人数有着密切关系，人均巧克力消耗越...

2024年2月22日统计调查已关闭评论

文章目录
繁