• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

R语言数据分析过程

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

R语言数据分析前期:预处理过程,供自己查阅,欢迎大家指正。

 

利用R语言导入数据

taobao<-read.csv("taobao.csv",stringsAsFactors = F)

我最常用到就是read.csv,其中stringsAsFactors=F很重要,不可缺少,否则会大大降低读入效率。

除此外还有read.table,他们分割符不同。

read.table(file(读入的数据名,不在默认路径下的要添加工作路径,注意使用双引号),

  header = FALSE(是否将第一行作为每一列的标题),

  sep = ""(分割符是什么,table默认“空”,csv默认“,”),
  row.names(行名称), col.names(列名称),

   as.is = !stringsAsFactors,

  na.strings = "NA", colClasses = NA, nrows = -1,

  skip = 0, check.names = TRUE, fill = !blank.lines.skip,
  strip.white = FALSE, blank.lines.skip = TRUE,
  comment.char = "#",
  allowEscapes = FALSE, flush = FALSE,
  stringsAsFactors = default.stringsAsFactors(),
  fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)


导入之后对数据以窗口形式进行查看:

View(taobao)

对导入的表格进行一个基本的统计:

summary(taobao)

 

 将数据中无用的字段删除:

taobao1<-taobao[c("买家应付货款","买家应付邮费","买家支付积分"
,"总金额","返点积分","买家实际支付金额"
,"买家实际支付积分","买家留言字数"
,"收货地址","运送方式","订单创建时间"
,"订单付款时间","宝贝标题","订单备注"
,"宝贝种类","物流公司","宝贝总数量")]

 


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
R语言基础 - gklee发布时间:2022-07-18
下一篇:
R语言和RStudio安装遇到的问题-Pigsss发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap