apply()函数常用于对DataFrame进行行迭代或者列迭代,它的axis的含义与统计聚合函数的axis的含义一致。apply()的参数往往是一个以序列为输入的函数,例如,对于mean(),使用a...
pandas的替换函数:在replace()函数
在replace()中,可以通过字典构造或者传入两个列表(分别表示需要替换的值和替换后的值)来进行替换: In : df.replace({'Female':0, 'Male':1}).head() ...
pandas的频次函数:unique()和nunique()函数
pandas中有一些函数和数据中元素出现的频次相关。对Series使用unique()和nunique()可以分别得到其唯一值组成的列表和唯一值的个数: In : df.unique() Out: a...
在pandas中,有哪些特征统计函数?
在pandas中,有哪些特征统计函数? 在Series和DataFrame上定义了许多统计函数,最常见的是sum()、mean()、median()、var()、std()、max()和min()。下...
pandas的汇总函数:head()函数和tail()函数
Series和DataFrame上存储了许多信息,但我们很多时候只需要获取其中的部分信息。当想要查看表的前几行或后几行时,可以使用head()函数和tail()函数,它们分别返回表或者序列的前n行和后...
pandas两种基本的数据结构:Series和DataFrame
pandas有两种基本的数据结构,分别是存储一维值属性values的Series和存储二维值属性values的DataFrame,在这两种数据结构上定义了很多属性和方法,pandas中的绝大多数数据处...
pandas的文件输入输出,安装第三方库的命令?
pandas的文件输入输出模块依赖xlrd、xlwt和openpyxl这3个第三方库,若未安装可使用如下命令安装: # 可以使用如下<em>conda</em>命令或<e...
NumPy数组的构造方式有哪些?
NumPy数组的构造方式多种多样,其中最一般的方法是通过array()来构造,下面的例子是把一个普通列表转换为NumPy数组: In : import numpy as np np.array() O...

什么是核密度估计?R语言绘制核密度图的函数是什么?
核密度图(kernel density plot)不仅能够直观地显示数据分布的尾巴,而且还能够显示分布的峰顶(peak)、肩部(shoulder)和凸块(bump)。 核密度估计是估计连续性随机变量概...
R语言数据包的加载、卸载、升级和查看帮助文档
在R里面使用非基础包是需要加载的,如果没有加载,程序就会提示“找不到所用函数”。加载数据包的方式有两种,library和require。library和require究竟哪个好用?正所谓“萝卜青菜各有...
R语言的三大数据类型是什么?
最常见的数据类型为数值型,包括定距和定序两种,在R语言中创建数值型变量非常简单,直接将数值赋值给对象即可,如下所示。 ● 数值型 1 a <-3 2 b <-3/2 3 mode(a) #...
R语言进行数据可视化有哪些优势?
R语言(有时简称R)是一款开源的数据分析和可视化编辑语言,常用于统计分析、图形绘制、数据挖掘、机器学习等领域。相比其他常见的统计分析与绘图软件,R语言在数据可视化方面具有诸多优势。 (1)R语言以“包...

R语言数据可视化的方法
经过开发者长期的努力,R语言已经扩展成为使用便利、功能完备的开发环境,能够支持包括数据存储、清洗、建模和可视化在内的完整工作流程。下面根据数据的类型、适用数据的可视化图形,以及用于数据可视化的R语言应...
R语言数据可视化的优点优势
R语言(有时简称R)是一款开源的数据分析和可视化编辑语言,常用于统计分析、图形绘制、数据挖掘、机器学习等领域。相比其他常见的统计分析与绘图软件,R语言在数据可视化方面具有诸多优势。 (1)R语言以“包...

R语言使用geom_hex函数绘制六角直方图
六角直方图所表达的信息与二维直方图一样,只不过六角直方图是将绘图区域划分为多个六边形,因此称为六角直方图。六角直方图使用geom_hex函数进行制作。下面的代码绘制了一幅六角直方图,如图5.36所示。...

R语言tidyverse包的管道操作符%>%
R中已经有大量的自带函数和强大的数据结构,可以用来完成复杂的数据探索、数据科学工作。但是,有一个包提供了一个简洁、完整的数据科学工作流程,这个包是tidyverse。tidyverse包提供了一个完整...