R的基本数据类型
R中5种基本的数据类型:
character-字符
numeric (real numbers)-数字
Integer-整数
Complex-复数
logical (True/False)-二元逻辑
还要注意数据的两种特殊的数据类型,即数据的缺失NA 和空值NULL
数据类型的转换
R中6种基本的数据结构:
向量(Vector)
矩阵(Matrix)
数组(Array)
因子(Factor)
列表(List)
数据框(Data Frame)
因子
数据框
列表
R中的控制语句
if, else: 条件控制
for: 循环控制
while: 条件循环控制
repeat: 无限重复循环
break: 中断本循环
next: 跳过指定的循环
函数
R可直接调用所需要的函数,其在R中其实只是一个普通的对象,只不过其类型为函数(”function”)
f <-function(<arguments>) {
## Do something interesting
}
函数特点
某函数可以是其他函数的参数
函数可以嵌套,用户可以自己定义函数
函数最终会返回某个结果
R函数的参数可以按照匹配,R 函数参数可以按照 位置匹配或名称匹配
可以使用args函数查看指定函数的参数情况,再通过名称匹配的方式输入相应的参数.
> args(lm)
function (formula, data, subset, weights, na.action,
method = "qr", model = TRUE, x = FALSE,
y = FALSE, qr= TRUE, singular.ok= TRUE,
contrasts = NULL, offset, ...)
下面两个函数是等价的
lm(data = mydata, y ~ x, model = FALSE, 1:100)
lm(y ~ x, mydata, 1:100, model = FALSE)
在大多情况下, 采用名称匹配的方式设置函数的参数,如果函数待设置的参数太多,可以考虑使用次序匹配函数。
名称匹配参数可以使用户更好的记住参数的取值,尤其在绘图时。
定义函数
f <-function(a, b = 1, c = 2, d = NULL) {
}
定义函数格式如上,有时不用指定参数的取值,有时可以设置参数值为空(NULL).
R 里的日期与时间类型很独特
日期被代表为日期类
时间被代表为POSIXct或POSIXlt类
日期起始计算时间为1970-01-01
时间被存储的日期为1970-01-01的秒的格式
读取数据
R中读取数据的函数.
read.table, read.csv, 读取二维表数据
*readLines, 按行读取文本
* source, 读取R代码
* dget, 读取R代码文件
* load, 读取工作空间
* unserialize, 读取R对象(二进制)
read.table函数参数介绍:
file, 文件名或路径
header, 是否读取表头
sep, 指定分隔符
colClasses, 指定数据集中的类别变量
nrows, 指定读取行的个数
comment.char, 指定注释
skip, 跳过读取指定的行
stringsAsFactors, 将字符型列进行因子转换