第一部分:数据结构
1.创建向量:c()
c(…, recursive = FALSE, use.names = TRUE)
根据元素坐标访问
2.创建矩阵:matrix()
matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE,dimnames = NULL)
使用下标访问矩阵元素
3.创建数组:array()
array(data = NA, dim = length(data), dimnames = NULL)
4.创建数据框:data.frame()
data.frame(…,
row.names = NULL,
check.rows = FALSE,
check.names=TRUE,
stringsAsFactors = default.stringsAsFactors())
访问数据框元素
还有attach()、detach()和with()方法。
5创建因子:factor()
factor(
x = character(),
levels, labels = levels,
exclude = NA,
nmax = NA)
因子的使用
显示对象结构
显示对象统计概要
6.创建列表:list()
list(x, all.names = FALSE, sorted = FALSE, …)
第二部分:输入数据
1.键盘输入:edit()
edit(name = NULL, file = “”, title = NULL,
editor = getOption(“editor”), …)
2.从带分隔符的ASCII文本文件导入数据:read.table()
read.table(file,
header = FALSE,
sep = “”,
quote = “\”’”,
dec = “.”,
numerals = c(“allow.loss”, “warn.loss”, “no.loss”),
col.names,
as.is = !stringsAsFactors,
na.strings = “NA”,
colClasses = NA, nrows = -1,
check.names = TRUE,
fill = !blank.lines.skip,
strip.white = FALSE,
blank.lines.skip = TRUE,
comment.char = “#”,
flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = “”,
text, skipNul = FALSE)
3.导入excel文件:RODBC包中的odbcConnectExcel()
odbcConnectExcel(xls.file, readOnly = TRUE, …)
加载RODBC包,odbc连接MicrosoftOffice
读取2007Office的xlsx文件,可以用XLSX包下的read.xlsx()
read.xlsx(file, sheetIndex, sheetName=NULL, rowIndex=NULL,
startRow=NULL, endRow=NULL, colIndex=NULL,
as.data.frame=TRUE, header=TRUE, colClasses=NA,
keepFormulas=FALSE, encoding=”unknown”, …)
加载xlsx包
4.导入网页内容:readLines()
在Web数据抓取(Webscraping)的过程中,用户从互联网上提取嵌入在网页中的信息,并将
其保存为R中的数据结构以做进一步的分析。完成这个任务的一种途径是使用函数readLines()
下载网页,然后使用如grep()和gsub()一类的函数处理它。对于结构复杂的网页,可以使用
RCurl包和XML包来提取其中想要的信息。更多信息和示例,请参考可在网站Programming with R
(www.programmingr.com)上找到的“Webscraping using readLines and RCurl”一文。
5.导入SPSS,SAP内容:
SPSS:oreign包中的函数read.spss()和Hmisc包中的spss.get()
SAP:foreign包中的read.ssd()和Hmisc包中的sas.get()
6.访问数据库管理系统
ODBC接口(以mysql为例)
*1 安装匹配系统和数据库的odbc驱动
*2 加载RODBC包
函数 |
描述 |
odbcConnect(dsn,uid=”“,pwd=”“) |
建立一个到odbc的连接 |
sqlFetch(channel,sqltable) |
读取odbc数据库中某个表到一个数据框中 |
sqlQuery(channel,query) |
向odbc数据库提交一个查询并返回结果 |
sqlSave(channel,mydf,tablename)=sqtable,append=FALSE |
将数据框写入或更新(append=TRUE)到odbc数据库的某个表中 |
sqlDrop(channel,sqtable) |
删除odbc数据库中的某个表 |
close(channel) |
关闭连接 |
第三部分 常用函数
函数 |
用途 |
length(object) |
显示对象元素/成分数量 |
dim(object) |
显示对象维度 |
str(object) |
显示对象结构 |
class(object) |
显示对象的类或类型 |
mode(object) |
显示对象模式 |
names(object) |
显示对象中成分名称 |
c(object,obj,…) |
将对象合并入一个向量 |
cbind(obj,obj,… |
按列合并对象 |
rbind(obj,obj,…) |
按行合并对象 |
object |
输出该对象 |
head(obj) |
列出对象开始部分 |
tail(obj) |
列出对象结尾部分 |
ls() |
显示当前对象列表 |
rm(obj,obj,…) |
删除对象 |
newobject <- edit(obj) |
编辑对象并另存为newobj |
fix(obj) |
|
|
请发表评论