在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
一.数据类型 5种 1.character 字符 2.numeric 数值 3.integer 整数 一般数字的存储会默认为数值类型,如果要强调是整数,需要在变量值后面加上 L。 x <- 5L class(x) 4.complex 复数 1+2i 5.logical 逻辑 TRUE&FALSE class()查看数据类型 R语言对大小写敏感
二。数据结构 属性:名称、维度、类型、向量结构 向量(vector):只能包含同一类型的对象。 创建向量方法1:x1 <- vector("integer",length = 4) 方法2:x2 <- 1:4 方法3:x3 <- c(1,2,3,4) 向量的其他特点,如果往向量里传的数据类型不一样,向量会强制转成同一种类型。x <- c(TRUE,10,"a") 结果都会转换成字符型元素。 向量数据类型的转换:as.xxx() 向量还可以给参量命名: names(向量名) <- c(跟参量数量一致的名字) 向量名
矩阵和数组|matrix&array 矩阵可以看做 向量+维度属性(整数向量:nrow,ncol) x<-matrix(1:4,nrow=2,ncol=2) 矩阵的填充方式是按列填充。 矩阵的相关函数:dim(x) 查看矩阵行列信息。 attributes()可以查询矩阵属性。 其他创建矩阵的办法(矩阵其实就是向量+维度信息) 矩阵的拼接: 按行拼接 按列拼接
数组 array 数组与矩阵非常相似,只是维度可以大于2
列表(是r中非常重要的数据结构
) 跟前面数据结构最大不同是可以包涵不同类型对象;可以直接给列表里的元素命名。 如何给矩阵的每行、每列命名? 用dimnames()
因子 分类数据,可分成有序和无序(按能否比大小来区分)
缺失值 NA&NaN NA不属于NaN,NaN属于NA NaN用来表示非法运算导致的缺失值,NA用来表示的范围更广。 相关函数,判断是否是na或nan is.na() 缺失值的处理,用平均数或者众数去补全。
数据框(data.frame()) 用来存储表格数据,跟列表、矩阵关系都很密切。
日期与时间结构 时间分成两个类型,POSIXct/POSIXlt 表示距离1970-01-01过去了多少秒。前者存储的数据是整数,常寸在数据框中 POSIXlt是列表,包含年月日星期等
一个数据矩阵的每一行数据叫作一次观测,每一列叫作一个变量。 |
请发表评论