R语言：批量循环读取一系列excel文件

OStack程序员社区-中国程序员成长平台 › 门户 › 编程› R语言›R语言教程

原作者: [db:作者] 来自: [db:来源] 收藏邀请

例如有20个excel文件分别代表20个亚组的数据，文件名为亚组名P01-P20，每个文件中的变量个数和名称等都是相同的，可通过以下命令实现一次性读取20个excel，并生成一个新变量提示来自哪个亚组（同时展示如何读取每个excel第二列数据的前11个字符生成一个新变量id）。

例如P01数据如下：

首先，读取excel文件先要安装package: XLConnect：

install.packages(XLConnect)
library(XLConnect)

其次，生成代表亚组名称的新变量和第二列前11个字符的新变量：

temp<-list.files(pattern="*.xls") //生成一个新变量temp代表文件路径中所有后缀为xls的文件的文件名

head(temp)

a=readWorksheetFromFile(temp[1],sheet=1) //读取temp1号excel即P01，命名为数据库a

a$plate=substr(as.character(temp[1]),1,3) //生成变量plate，数值为temp里的plate名称（字符1到3）

a$id=substr(a[,2],1,11) //生成变量id, 值为第二列数据的前11个字符

ncol(a) //看看a有多少个变量，新生成的plate和id变量为最后两个，假设为第58和59个变量

write.table(a[,c(58,59)],file = "newfile.txt",row.names=F, na="",col.names=FALSE, sep=" ",append = T,quote=F)

//生成txt文件newfile.txt为p01文件中的plate和id，展示如下

最后，对P02-20写一个for循环语句，导入进去即可

for (i in 2: length(temp)){
newfile=read.table("newfile.txt")
b=readWorksheetFromFile(temp[i],sheet=1)
b$row=substr(as.character(temp[i]),1,3)
b$extract=substr(b[,2],1,11)
write.table(b[,c(58,59)],file = "newfile.txt",row.names=F, na="",col.names=FALSE, sep=" ",append = T,quote=F)
}

//命令翻译：对每一个i值，i从2到temp的最大值之间取值，生成一个文件newfile=之前P01的txt文件，下面四行是重复上面生成P01file的过程。