在R里面使用非基础包是需要加载的,如果没有加载,程序就会提示“找不到所用函数”。加载数据包的方式有两种,library和require。library和require究竟哪个好用?正所谓“萝卜青菜各有所爱”。
1.用library加载安装包
library是我个人最常用的加载包的函数,这只是个人偏好而已。
用library加载包时,将包的名称用英文双引号或单引号括起来即可执行,当然直接书写包的名称也可以完成加载,执行后就将用于进行关联规则分析的包arules加载进内存了,代码如下。
● library加载包
1 library("arules")
2 library(arules)
2.用require加载安装包
require函数也可以加载数据包,代码同样简单。如下所示。
● require加载包
1 require('arules')
2 require(arules)
但library和require还是有区别的,在后面的章节有可能用到它们的区别之处,特别是上面提到的自动化状态下,就要视情况选择使用二者之一。
● library 和 require的区别
1 libraryreturn <-library('arules')
2 libraryreturn
3 requirereturn <-require('arules')
4 requirereturn
library返回的是加载包的名称,包括依赖包,所谓依赖包就是在使用某些包时还需要加载其他相关包,而require返回的是一个逻辑值,即布尔数值,加载成功返回真(TURE),加载失败返回假(FALSE)。
3.卸载数据包
你这是逗我吗?刚装上又要卸载?其实包的卸载真的没啥用处,包如果不加载到内存就是没用的东西,既不会影响速度也不会占内存,唯一的缺点就是占点硬盘空间。但是如果非要卸载,这里提供一种最简单的方法,即找到R的安装目录,在“library”文件夹中直接删除以相应数据包命名的文件夹即可。
4.升级数据包
数据包写好以后是一成不变的吗?数据包也会像软件一样更新,一个高效功能更加全面的版本替代一个原始版本很正常,所以大家在使用某些包时要注意自己所选择的版本号,有些包更新之后相关函数的变化很大,甚至连名称都会改变,所以在更新数据包时一定要注意到这一点。
在RStudio下可以点击右下栏的“Packages”下的“Update”完成升级,在RGui中可以点击“程序包”选择更新程序包,或者直接重新安装就可以升级到最新版本。
也可以使用下面的函数对数据包进行升级。
1 update.packages()
5.如何查看安装包说明文档
有时候安装了数据包之后需要查看一下包的说明文档,比如包里有哪些函数、函数的使用案例、包的作者等。
输入两个英文问号和包名称,即可返回Vignettes页面(Rstudio在右下栏),点击相应的PDF文件就可以查看到包的说明文档,一般经过审查的官方源上的包,说明文档都是英文。
● 查看包的说明文档
1? ? arules
6.查看函数的帮助文档和用例
R通过查看数据包的说明文档,可以了解到数据包包含哪些有用的函数,而查看函数的帮助文档有更简单的方法,如下所示。
1 * help(函数名)
2 *?函数名
在终端输入help函数,并将函数名作为参数,就可以查看该函数的帮助文档,或者在终端输入英文问号加函数名同样能看到函数的帮助文档,包括函数的描述、参数说明、一些计算细节还有相关文献,最后还有用例。有一点可以肯定,R的函数说明文档要比Python更加详细,这也是我认为R的数据挖掘模块要比Python更加专业的原因,在高级语言中,如果没有审核机制,真的是一场灾难,你只能相信自己。例如查看dim函数的帮助文档,如下所示。
● 查看函数帮助文档
1 help(dim)
2? dim
看到函数的相关信息之后,想知道怎么样使用,可以阅读文档的后面的用例,当然你也可以在控制台下查看函数如何使用。代码如下所示。
● 查看并执行函数用例
1 example(dim)
dim函数用于查看一个矩阵或数据框的行列数,或者改变矩阵或数据框的行列数。在这里表达一下对R数据包开发者的敬意,先不说开发一个包有多难,仅准备所需的说明文档和用例就已经十分烦琐,能够有如此毅力的开发者值得我们尊敬。