• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

[读书笔记] R语言实战 (四) 基本数据管理

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

1. 创建新的变量

mydata<-data.frame(x1=c(2,2,6,4),x2=c(3,4,2,8))
#方法一
mydata$sumx<-mydata$x1+mydata$x2
mydata$meanx<-(mydata$x1+mydata$x2)/2
#方法二
attach(mydata)
mydata$sumx <- x1+x2
mydata$meanx <- (x1+x2)/2
detach(mydata)
#第三种方式
mydata<-transform(mydata,sumx=x1+x2,meanx=(x1+x2)/2)

2. 变量的重编码

连续->类别

错误->正确值

分数->级别划分

3. 变量的重命名

reshape()包中的rename()函数

rename(dataframe, c(oldname=\'newname\',oldname = \'newname\')

4. 缺失值

缺失值:NA(Not Availabe不可用表示)

不可能出现的值:NAN(Not a number, 非数值)

 is.na() 检查是否是缺失值

na.rm= TRUE 在计算之前移除缺失值

na.omit()删除所有不完整的规则

5. 日期值:日期值以字符串形式输入到R,然后转化为以数值形式存储的日期变量

as.Date(x, "input_format")

#日期默认输入格式为yyyy-mm--dd
mydates <- as.Date(c(\'2007-06-22\',\'2004-02-13\'))
#新的输入格式
strDates <-c(\'01/05/1965\',\'08/16/1975\')
dates <- as.Date(strDates,"%m/%d/%Y")
#日期转化为字符型变量
strDates <- as.character(dates)

6. 数据类型转化

7. 数据排序

order() 对数据进行排序, 默认顺序是升序,在排序变量前面添加一个减号就可以得到降序的排序结果

8. 数据集的合并

1). 列合并:向数据框中添加变量 merge(dataframeA, dataframeB, by = \'ID\')

2). 行合并:向数据框中添加观测 rbind()

3). subset()函数 

newdata <- subset(dateframe, conditions, select = c(col1,col2))

4) 抽样函数 sample()

 


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
R语言ETL系列:创建字段(mutate)发布时间:2022-07-18
下一篇:
R语言set.seed()函数发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap