R语言数据分析过程

R语言数据分析前期：预处理过程，供自己查阅，欢迎大家指正。

利用R语言导入数据：

taobao<-read.csv("taobao.csv",stringsAsFactors = F)

我最常用到就是read.csv，其中stringsAsFactors=F很重要，不可缺少，否则会大大降低读入效率。

除此外还有read.table，他们分割符不同。

read.table(file（读入的数据名，不在默认路径下的要添加工作路径，注意使用双引号）,

　　header = FALSE（是否将第一行作为每一列的标题）,

　　sep = ""（分割符是什么，table默认“空”，csv默认“，”）,
　　row.names（行名称）, col.names（列名称）,

　　 as.is = !stringsAsFactors,

　　na.strings = "NA", colClasses = NA, nrows = -1,

　　skip = 0, check.names = TRUE, fill = !blank.lines.skip,
　　strip.white = FALSE, blank.lines.skip = TRUE,
　　comment.char = "#",
　　allowEscapes = FALSE, flush = FALSE,
　　stringsAsFactors = default.stringsAsFactors(),
　　fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)

导入之后对数据以窗口形式进行查看：

View(taobao)

对导入的表格进行一个基本的统计：

summary(taobao)

将数据中无用的字段删除：

taobao1<-taobao[c("买家应付货款","买家应付邮费","买家支付积分"
,"总金额","返点积分","买家实际支付金额"
,"买家实际支付积分","买家留言字数"
,"收货地址","运送方式","订单创建时间"
,"订单付款时间","宝贝标题","订单备注"
,"宝贝种类","物流公司","宝贝总数量")]

客服电话

电子邮件

请发表评论

全部评论

上一篇：

下一篇：

关于我们

产品与服务

解决方案

139-2527-9053