在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
根据样本数据随机选择20%做测试样本,80%做训练样本 # 数据划分 set.seed(1234) # 设置随机种子,改成set.seed(5)...都行,R语言中set.seed(),该命令的作用是设定生成随机数的种子,种子是为了让结果具有重复性。如果不设定种子,生成的随机数无法重现。 ( > set.seed(5) #设定种子 > x<-rnorm(10) # 在设定种子的前提下生成10个随机数 > x [1] -0.84085548 1.38435934 -1.25549186 0.07014277 1.71144087 -0.60290798 -0.47216639 [8] -0.63537131 -0.28577363 0.13810822 > set.seed(5) # 设定种子 > y<-rnorm(10) > y [1] -0.84085548 1.38435934 -1.25549186 0.07014277 1.71144087 -0.60290798 -0.47216639 [8] -0.63537131 -0.28577363 0.13810822 )# 定义序列ind,随机抽取1和2,1的个数占80%,2的个数占20%ind <- sample(2, nrow(Data), replace = TRUE, prob = c(0.8, 0.2)) trainData <- Data[ind == 1,] # 训练数据 testData <- Data[ind == 2,] # 测试数据 # 数据存储 write.csv(trainData, "./tmp/trainData.csv", row.names = FALSE) write.csv(testData, "./tmp/testData.csv", row.names = FALSE) 。。。。。。。。。。。。。。。。完。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。 > set.seed(1234) # 设置随机种子 其他关于sample()的小例子 > x=1:10 [1] 5 9 2 10 7 4 1 8 6 3 > x=1:1000 [15] 194 995 402 343 820 195 > x=1:10 [1] 9 4 2 4 4 > a=c("A","B") [1] "A" "A" "B" "B" "B" "B" "B" "A" "A" "A" |
请发表评论