第二章 创建数据集
1.R语言的数据类型
数值型、字符型、逻辑型、复数型(虚数)和原生型(字节)
2.数据结构
a.向量:存储数值型、字符型和逻辑型数据的一维数组
> a=c(1,2,3,4,5)#创建 组合功能的函数c()
> a
[1] 1 2 3 4 5
> a[c(1,4)]#访问 方括号+向量中指定的元素
[1] 1 4
b.矩阵:二维数组
mymatrix=matrix(1:20,nrow=5,ncol=4,byrow=TRUE,dimnames=list(rnames,cnames))#创建
#参数:元素,行,列,是否按行填充,行列的标签
mymatrix[i,j]#访问 方括号+向量中指定的元素
c.数据:与矩阵类似,但唯独可以大于2
z=array(1:24,c(2,3,4),dimname=list(dim1,dim2,dim3))#创建
#参数:元素,a*b*c维,维数行列标签
z[1,2,3]#访问 方括号+向量中指定的元素
d.数据框:不同列可以包含不同数据类型的数据
mydata=data.frame(coll,coll,coll)#创建 coll为列向量,可任意类型
mydata[1:2]#访问 得到数据框
mydata$coll#访问 得到向量
attach(mydata)#访问 得到向量
summary(mydata)
polt(coll,coll)
detach(mydata)#最好分析单个数据框
with(mydata,{
coll1=summary(coll2)##访问并处理数据框的数据
})#赋值仅在此函数的括号生效
e.因子:类别变量和有序类别变量在R中称为因子
diabetes=factor(data,ordered=TRUE,levels=c(....))#创建
#参数:元素,是否按照有序变量对待,自定义级别
f.列表:一些对象的有序结合,允许整合若干对象到单个对象名下
mylist=list(tittle="hello!",ages=coll,coll)#创建
mylist[[2]]#访问 双重方括号
mylist[["ages"]]
3.数据的输入
a.键入数据
mydata=edit(dataname)#键入数据
b.从带分隔符的文本文件导入数据
data=read.table("mydata.csv",header=TRUE,sep=",",row.name="XXX")#导入csv
#参数:文件名,首行逻辑值,分隔符,将XXX指定为行标识符
其他略......
请发表评论