R 线性回归中的多重共线性 多重共线性是指模型中的自变量之间存在较高的相关关系,如自变量 x 1 , x 2 之间的关系为 x 1 =2 x 2 。多重共线性的存在会影响模型的准确性及稳定性,方差膨胀因子(vif)可以用于检验自... 2024年3月21日线性回归中的多重共线性已关闭评论 阅读全文
自变量为分类变量的处理:什么是哑变量? 线性回归建模速度快,不需要很复杂的计算,在数据量大的情况下依然能够快速运行,可以根据系数给出每个变量的解释,但不能很好地拟合非线性数据,所以在构建回归模型时需要先判断自变量的类型。 分类变量(也称为因... 2024年3月21日 R自变量为分类变量的处理:什么是哑变量?已关闭评论 阅读全文
在pandas中,apply()函数的使用方法? apply()函数常用于对DataFrame进行行迭代或者列迭代,它的axis的含义与统计聚合函数的axis的含义一致。apply()的参数往往是一个以序列为输入的函数,例如,对于mean(),使用a... 2023年2月16日 R在pandas中,apply()函数的使用方法?已关闭评论 阅读全文
pandas的替换函数:在replace()函数 在replace()中,可以通过字典构造或者传入两个列表(分别表示需要替换的值和替换后的值)来进行替换: In : df.replace({'Female':0, 'Male':1}).head() ... 2023年2月16日 Rpandas的替换函数:在replace()函数已关闭评论 阅读全文
pandas的频次函数:unique()和nunique()函数 pandas中有一些函数和数据中元素出现的频次相关。对Series使用unique()和nunique()可以分别得到其唯一值组成的列表和唯一值的个数: In : df.unique() Out: a... 2023年2月16日 Rpandas的频次函数:unique()和nunique()函数已关闭评论 阅读全文
在pandas中,有哪些特征统计函数? 在pandas中,有哪些特征统计函数? 在Series和DataFrame上定义了许多统计函数,最常见的是sum()、mean()、median()、var()、std()、max()和min()。下... 2023年2月16日 R在pandas中,有哪些特征统计函数?已关闭评论 阅读全文
pandas的汇总函数:head()函数和tail()函数 Series和DataFrame上存储了许多信息,但我们很多时候只需要获取其中的部分信息。当想要查看表的前几行或后几行时,可以使用head()函数和tail()函数,它们分别返回表或者序列的前n行和后... 2023年2月16日 Rpandas的汇总函数:head()函数和tail()函数已关闭评论 阅读全文
pandas两种基本的数据结构:Series和DataFrame pandas有两种基本的数据结构,分别是存储一维值属性values的Series和存储二维值属性values的DataFrame,在这两种数据结构上定义了很多属性和方法,pandas中的绝大多数数据处... 2023年2月16日 Rpandas两种基本的数据结构:Series和DataFrame已关闭评论 阅读全文
pandas的文件输入输出,安装第三方库的命令? pandas的文件输入输出模块依赖xlrd、xlwt和openpyxl这3个第三方库,若未安装可使用如下命令安装: # 可以使用如下<em>conda</em>命令或<e... 2023年2月16日 Rpandas的文件输入输出,安装第三方库的命令?已关闭评论 阅读全文
NumPy数组的构造方式有哪些? NumPy数组的构造方式多种多样,其中最一般的方法是通过array()来构造,下面的例子是把一个普通列表转换为NumPy数组: In : import numpy as np np.array() O... 2023年2月16日 RNumPy数组的构造方式有哪些?已关闭评论 阅读全文
R 什么是核密度估计?R语言绘制核密度图的函数是什么? 核密度图(kernel density plot)不仅能够直观地显示数据分布的尾巴,而且还能够显示分布的峰顶(peak)、肩部(shoulder)和凸块(bump)。 核密度估计是估计连续性随机变量概... 2023年1月27日什么是核密度估计?R语言绘制核密度图的函数是什么?已关闭评论 阅读全文
R语言数据包的加载、卸载、升级和查看帮助文档 在R里面使用非基础包是需要加载的,如果没有加载,程序就会提示“找不到所用函数”。加载数据包的方式有两种,library和require。library和require究竟哪个好用?正所谓“萝卜青菜各有... 2022年9月22日 RR语言数据包的加载、卸载、升级和查看帮助文档已关闭评论 阅读全文
R语言的三大数据类型是什么? 最常见的数据类型为数值型,包括定距和定序两种,在R语言中创建数值型变量非常简单,直接将数值赋值给对象即可,如下所示。 ● 数值型 1 a <-3 2 b <-3/2 3 mode(a) #... 2022年9月22日 RR语言的三大数据类型是什么?已关闭评论 阅读全文
R语言进行数据可视化有哪些优势? R语言(有时简称R)是一款开源的数据分析和可视化编辑语言,常用于统计分析、图形绘制、数据挖掘、机器学习等领域。相比其他常见的统计分析与绘图软件,R语言在数据可视化方面具有诸多优势。 (1)R语言以“包... 2022年9月20日 RR语言进行数据可视化有哪些优势?已关闭评论 阅读全文
R R语言数据可视化的方法 经过开发者长期的努力,R语言已经扩展成为使用便利、功能完备的开发环境,能够支持包括数据存储、清洗、建模和可视化在内的完整工作流程。下面根据数据的类型、适用数据的可视化图形,以及用于数据可视化的R语言应... 2022年5月31日R语言数据可视化的方法已关闭评论 阅读全文
R语言数据可视化的优点优势 R语言(有时简称R)是一款开源的数据分析和可视化编辑语言,常用于统计分析、图形绘制、数据挖掘、机器学习等领域。相比其他常见的统计分析与绘图软件,R语言在数据可视化方面具有诸多优势。 (1)R语言以“包... 2022年5月31日 RR语言数据可视化的优点优势已关闭评论 阅读全文
R R语言使用geom_hex函数绘制六角直方图 六角直方图所表达的信息与二维直方图一样,只不过六角直方图是将绘图区域划分为多个六边形,因此称为六角直方图。六角直方图使用geom_hex函数进行制作。下面的代码绘制了一幅六角直方图,如图5.36所示。... 2022年5月30日R语言使用geom_hex函数绘制六角直方图已关闭评论 阅读全文
R R语言tidyverse包的管道操作符%>% R中已经有大量的自带函数和强大的数据结构,可以用来完成复杂的数据探索、数据科学工作。但是,有一个包提供了一个简洁、完整的数据科学工作流程,这个包是tidyverse。tidyverse包提供了一个完整... 2022年5月30日R语言tidyverse包的管道操作符%>%已关闭评论 阅读全文