在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
1.1 随机抽样在R中,函数sample模拟随机抽样,(sample的默认行为是无放回抽样,加上replace=T放回抽样,prob函数调节概率) > sample(1:40,5) [1] 6 33 8 22 11 > sample(40,5) [1] 18 34 11 1 25 > sample(40,5,replace = TRUE) [1] 15 5 11 22 19 > sample(c("H","T",10,replace = TRUE)) > sample(c("H","T"), 10,replace = TRUE) [1] "T" "T" "T" "T" "T" "H" "T" "T" "T" "T" 1.2 概率计算和排列组合prod函数计算数字向量的乘积 > 1/prod(40:36) [1] 1.266449e-08 > 1/(40*39*38*37*36) [1] 1.266449e-08 > prod(5:1)/prod(40:36) [1] 1.519738e-06 1.3 单组的汇总统计量(均值,标准差,方差,中位数,分位数)> x <- rnorm(50) > mean(x) [1] 0.3359321 > sd(x) [1] 0.9801387 > var(x) [1] 0.960672 > median(x) [1] 0.3689863 > prec <- seq(0,1,0.1) > prec [1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 > quantile(x,prec) 0% 10% 20% 30% 40% 50% 60% -2.01305247 -0.84689225 -0.43141014 -0.08854443 0.18039782 0.36898631 0.50080508 70% 80% 90% 100% 0.73967146 1.24424664 1.64024475 2.22367451 如果数据中有缺失值得存在,用na.rm(not available,remove)参数来移除未知值。 > summary(quantile(x,prec)) Min. 1st Qu. Median Mean 3rd Qu. Max. -2.0130 -0.2600 0.3690 0.3198 0.9920 2.2240 summary 对整个数据框进行汇总 1.4分布的图形展示直方图 hist(x)
经验累积分布函数 > n <- length(x) > plot(sort(x),(1:n)/n, type = "s", ylim = c(0,1)) Q-Q图(画出第K个最小观测值和来自标准正态分布的N个值中第K个最小观测值) qqnorm(x)
计算经验累积分布函数的目的之一,观察数据是否能被假设成来自正态分布。如果是,则是一条直线。 1.5 分组数据的汇总统计量> attach(red.cell.folate) > tapply(folate, ventilation,mean) N2O+O2,24h N2O+O2,op O2,24h 316.6250 256.4444 278.0000tapply 函数调用提取folate变量,根据ventilation分组,然后对每一组计算均值都用同样的方法 |
请发表评论