R中其他读取:
source #读取R代码
dget #读取R文件
load #读取工作空间
一。R语言读取文本文件(.txt)
在R语言中,读取文本文件的函数可以是:read.table()、scan()、read.fwf(),也可以将.txt转换为.csv或.xlsx文件用其他函数读取。
1. read.table()
参数解释:
-
file:字符型,用""分隔,文件名称,要从中读取文件的完整路径;file的读取可用file.choose()来选择;
-
header: 逻辑型,指定是否在首行包含变量名,默认为 FALSE;
-
sep: 字符型,分割字符,默认为"",代表空白字符,包括空格(一个或多个)、制表符、 换行符、回车;
- quote :指定用于包围字符型数据的字符;
- dec:字符型,制定小数点字符,默认为.,一般不用修改;
- numerals:字符型,在数字转换会损失精度时的处理方法,allow.loss 表示允许精度损失;warn.loss 允许精度损失,但显示一条警告信息;no.loss 不允许精度损失,即不转换为数字,而是转换为因子或者不转换,保留字符串形式;
- row.names:字符向量,为行指定名称,未定义时以1、2、3、4...代替;
- col.names:字符向量,为列指定名称,若列名在第一行定义好了,可不用,未定义时,以V1、V2、V3...代替;
-
stringAsFactors:逻辑型,是否将字符串自动编码为因子,默认为 TRUE,当数据量很大时,可将该值设定为F;
- na.strings:字符向量,定义代表缺失值的字符串,比如c("N",".")会将 "N" 和"." 两个字符读取为缺失值,默认为 "NA";
- colClasses: 字符向量为列指定类型,比如c("numeric","character")指定第一列为数值型,第二列为字符型,若将某列指定为字符串,则不会将其自动编码为因子,默认即可;colClasses=c("xx"="numeric","cc"="logical"...
- nrows:数值型,读取的最大行数,负数为不限制;
- skip:数值型,读取前跳过的行数;
-
check.names: 逻辑型,是否检查变量名在 R 中的有效性,默认为TRUE,会将不符合语法的变量修改;
- fill:逻辑型,是否自动填充空白值,若各变量行数不一致,是否为空白列添加空白值;
-
strip.white:逻辑型,是否自动过滤掉字符型变量前后的空格;
- comment.char: 字符型,注释字符,以此字符开头的行将被忽略;
-
blank.lines.skips:逻辑型,是否忽略空白行,默认为 TRUE;
- allowEscapes: 逻辑型,是否处理 C 语言风格的转义符;
- text: 字符型,直接指定要读取的字符串,此时 file 应该为空;
- encoding: 字符型,输入文本的编码,若出现乱码,请尝试更改此选项;
- fileEncoding: 字符型,文件编码,若出现乱码,请尝试更改此选项。
注意:read.csv()、read.csv2()、read.delim()、read.delim2()都是read.table()部分参数(sep、dec)的变形。read.csv()、read.csv2()中file为.csv文件,分隔符为逗号或分号;read.delim()、read.delim2()中file的分隔符为tab键(制表符),在使用以下四个函数时,它们的参数已被固定,而read.table()可以更多变化的读取数据。即可以将文本文件存储为.csv等文件继续分析数据。
对应的写文件如write.table 、write.csv,
2.scan()、read.fwf( ),readLines()下次遇见了再补充吧:)
二。.xlsx文件读取
1.利用剪切板
2.RODBC包:数据库读入(遇见了再补充)
3.xlsx包:批量读取
此包需要rjava包并配置Java环境
|
请发表评论