一、R语言应知常用函数
1、getwd() 函数:获取工作目录(同eclipse设置workspace类似),直接在R软件中使用,如下图:
2、setwd(dir=”工作目录”) 函数:设置R软件RStudio的工作目录,如下图(注意目录写法):
3、list.files()函数(同dir()函数):查看R软件当前工作目录下的文件,如下图:
4、一般赋值符号:<- 或-> ,如x<-3 或3->x,表示x等于3
5、ls()函数:查看工作空间中的所有变量;ls.str()函数:查看空间中的所有变量值;str(变量)函数:查看某个变量的值,如下图:
6、rm()函数:删除工作空间中的变量,如rm(x)、rm(b,x)删除多个变量、rm(list=ls())删除所有对象,如下图:
7、history()函数,查看历史使用的函数,可指定数量,如history(5)
8、save.image()保存当前工作空间,把当前工作空间信息保存到一个文件中
9、q()退出函数
10、load(dir)函数,加载保存的空间的信息,如:load("D:/Rworkspace/.RData")
11、install.packages()函数,安装R中的包,相当于java 中的第三方jar包,.net中的第三方dll文件,如install.packages("Finance")引号必须加,Finance是金融包,如下图:
提示:可在R语言网站https://cran.r-project.org/ 的Task Views 下查询自已所需要的包。
12、library()函数,查看R软件中本地安装了哪些包,.libPaths()函数查看安装的路径,如下图:
13、require()或library()函数:载入包,如require(vcd)或library(vcd),前提是安装了vcd包,如下图:
14、help()函数:查看帮助文档,也可以使用“?”,如:?help 、help(package="vcd"),如下图:
15、detach()函数移出加载的包,如detach("package:vcd") ,移出后包中的数据函数都不能直接使用;
16、remove.packages() 函数,删除安装的包;
17、help.start()查看帮助文档,help(函数名)或?函数名(??包里的函数):查看函数的帮助文档;args(函数名):查看函数的参数,example(函数名):查看示例,如下图:
demo(graphics) 查看示例图:
vignette() 查看包的开发文档,不是所有的包都有这个文档
Rsitesearch() 打开浏览器搜索
Help.search() 本地搜索
二、内置数据集
可以使用help(package="datasets") 查看R中默认安装的数据集
1、data()函数查看数据集,如下图:
可以直接使用数据集名称来使用数据集,如rivers、mtcars等,可以使help(“rivers”)来查看数据集帮助文档,如下图:
data(package="MASS") :查看MASS包中的数据集;
2、names(数据集名):查看数据集里的属性
3、内置数据集
参考:
https://ke.qq.com/course/366588?taid=2769996208248828&dialog=1
三、数据结构
数据结构:按某种逻辑关系组织起来存储于计算机存储器中,并定义了一个运算的数据元素集合;简单的说就是数据在计算机存储器或寄存器中怎么存储的,比如,java中的数组,底层现实是用数据结构中的数组实现的;数据结构主要包括:数组、栈、队列、链表、树、散列表、堆、图。
数据类型:可认为是编程语言将数据不同的分类,比如C语言中的数据类型包括整型、浮点型、字符型、字符串型等等;R语言也有自己的数据类型。
R语言数据类型:R语言与其他语言一样,包括数值型、字符串型、逻辑型、日期型等等,但R中使用最多数据类型是:字符串、向量、数组、列表、矩阵、数据帧,这也是学习R语言与其他语言不同的地方;
3.1、字符串
R语言中出现字符串的地方须使用引号,根其他编程语言一样,可以使用“”或‘’,“”号中可以有‘’号,如图:
3.1.1、操作字符串相关函数
1、nchar(参数):查看字符串的长度,参数可为字符串、向量
2、length(参数):查看字符串或向量中字符串的个数,参数可为字符串、向量
3、paste(...,sep=” ”,collapse ):合并字符串,也可以向量和字符串相连,sep是指定合并的分隔符,默认为空格,如下:
不清楚用法也可以查看帮助文档
4、substr(参数,start,stop):截取字符串,start开始索引,从一开始;stop停止索引,参数可为字符串、向量
5、toupper(参数)、 tolower(参数):将字符串转换为大小写,参数可为字符串、向量,如图:
6、grep(字符串,参数):在参数中查找字符串,支持模糊查找,返回开始位置,参数可为字符串、向量;
7、match(字符串,向量):在向量中查找字符串的位置,不支付模糊查找;
8、strsplit(字符串,分隔符):将字符串按分隔符分隔,如下图:
9、Format():格式化
3.1.2、向量 vector
1、基本概念:R中的向量是由一个或多个数据元素组成,数据元素包括数值、字符串或逻辑值的一维数组(同一类型),可以理解为其他高级语言中的数组;不同于数学中的向量概念;
R语言是向量化编程,用函数c来创建向量,combines ,如:x<-c(1,2,3,4)或 b<-c(1:4) ,输入b,默认调用print()函数打印,如下图:
字符串:y<-c("hrtr","ssgdg","tesst")
逻辑值:z<-c(T,F)
2、seq(from,to,by,length.out):生成等差数列,from开始值,to结束值,by等差,length.out个数,如下图:
3、rep(x,times,each) 重复函数,x可是值或向量,times指重复的次数,each每个元素重复次数,如下图:
4、mode(x):查看类型
5、向量的运算:R中向量可以使用四则运算,两个向量元素一一运算,较短的向量会被重复使用,如下图:
6、sort(x):排序,可以对向量排序
3.1.3、向量索引
向量索引是从1开始,而不是0开始,访问方式与其他语言的数组一样,如:x[index],index可以是值、向量,使用负索引(负值、负向量)则是排除某个值或多个值,如下图:
1、names(y) :给向量指定名称,如下图:
3.1.4、矩阵
概念:是一个按照长方阵排列的复数或实数集合。向量是一维的,矩阵量二维的,有行列
其中元素以二维矩形布局布置的R对象。 它们包含相同原子类型的元素。 虽然我们可以创建一个只包含字符或只包含逻辑值的矩阵,但它们没有太多用处。 我们使用包含数字元素的矩阵用于数学计算。
1、matrix()函数。