线性回归中的多重共线性 R

线性回归中的多重共线性

多重共线性是指模型中的自变量之间存在较高的相关关系,如自变量 x 1 , x 2 之间的关系为 x 1 =2 x 2 。多重共线性的存在会影响模型的准确性及稳定性,方差膨胀因子(vif)可以用于检验自...
阅读全文

自变量为分类变量的处理:什么是哑变量?

线性回归建模速度快,不需要很复杂的计算,在数据量大的情况下依然能够快速运行,可以根据系数给出每个变量的解释,但不能很好地拟合非线性数据,所以在构建回归模型时需要先判断自变量的类型。 分类变量(也称为因...
阅读全文

在pandas中,apply()函数的使用方法?

apply()函数常用于对DataFrame进行行迭代或者列迭代,它的axis的含义与统计聚合函数的axis的含义一致。apply()的参数往往是一个以序列为输入的函数,例如,对于mean(),使用a...
阅读全文

pandas的替换函数:在replace()函数

在replace()中,可以通过字典构造或者传入两个列表(分别表示需要替换的值和替换后的值)来进行替换: In : df.replace({'Female':0, 'Male':1}).head() ...
阅读全文

pandas的频次函数:unique()和nunique()函数

pandas中有一些函数和数据中元素出现的频次相关。对Series使用unique()和nunique()可以分别得到其唯一值组成的列表和唯一值的个数: In : df.unique() Out: a...
阅读全文

在pandas中,有哪些特征统计函数?

在pandas中,有哪些特征统计函数? 在Series和DataFrame上定义了许多统计函数,最常见的是sum()、mean()、median()、var()、std()、max()和min()。下...
阅读全文

pandas的汇总函数:head()函数和tail()函数

Series和DataFrame上存储了许多信息,但我们很多时候只需要获取其中的部分信息。当想要查看表的前几行或后几行时,可以使用head()函数和tail()函数,它们分别返回表或者序列的前n行和后...
阅读全文

pandas两种基本的数据结构:Series和DataFrame

pandas有两种基本的数据结构,分别是存储一维值属性values的Series和存储二维值属性values的DataFrame,在这两种数据结构上定义了很多属性和方法,pandas中的绝大多数数据处...
阅读全文

NumPy数组的构造方式有哪些?

NumPy数组的构造方式多种多样,其中最一般的方法是通过array()来构造,下面的例子是把一个普通列表转换为NumPy数组: In : import numpy as np np.array() O...
阅读全文

R语言数据包的加载、卸载、升级和查看帮助文档

在R里面使用非基础包是需要加载的,如果没有加载,程序就会提示“找不到所用函数”。加载数据包的方式有两种,library和require。library和require究竟哪个好用?正所谓“萝卜青菜各有...
阅读全文

R语言的三大数据类型是什么?

最常见的数据类型为数值型,包括定距和定序两种,在R语言中创建数值型变量非常简单,直接将数值赋值给对象即可,如下所示。 ● 数值型 1 a <-3 2 b <-3/2 3 mode(a) #...
阅读全文

R语言进行数据可视化有哪些优势?

R语言(有时简称R)是一款开源的数据分析和可视化编辑语言,常用于统计分析、图形绘制、数据挖掘、机器学习等领域。相比其他常见的统计分析与绘图软件,R语言在数据可视化方面具有诸多优势。 (1)R语言以“包...
阅读全文
R语言数据可视化的方法 R

R语言数据可视化的方法

经过开发者长期的努力,R语言已经扩展成为使用便利、功能完备的开发环境,能够支持包括数据存储、清洗、建模和可视化在内的完整工作流程。下面根据数据的类型、适用数据的可视化图形,以及用于数据可视化的R语言应...
阅读全文

R语言数据可视化的优点优势

R语言(有时简称R)是一款开源的数据分析和可视化编辑语言,常用于统计分析、图形绘制、数据挖掘、机器学习等领域。相比其他常见的统计分析与绘图软件,R语言在数据可视化方面具有诸多优势。 (1)R语言以“包...
阅读全文
R语言使用geom_hex函数绘制六角直方图 R

R语言使用geom_hex函数绘制六角直方图

六角直方图所表达的信息与二维直方图一样,只不过六角直方图是将绘图区域划分为多个六边形,因此称为六角直方图。六角直方图使用geom_hex函数进行制作。下面的代码绘制了一幅六角直方图,如图5.36所示。...
阅读全文
R语言tidyverse包的管道操作符%>% R

R语言tidyverse包的管道操作符%>%

R中已经有大量的自带函数和强大的数据结构,可以用来完成复杂的数据探索、数据科学工作。但是,有一个包提供了一个简洁、完整的数据科学工作流程,这个包是tidyverse。tidyverse包提供了一个完整...
阅读全文