• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

R语言概率与分布

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

1.1  随机抽样

在R中,函数sample模拟随机抽样,(sample的默认行为是无放回抽样,加上replace=T放回抽样,prob函数调节概率)

> sample(1:40,5)
[1]  6 33  8 22 11
> sample(40,5)
[1] 18 34 11  1 25
> sample(40,5,replace = TRUE)
[1] 15  5 11 22 19
> sample(c("H","T",10,replace = TRUE))
> sample(c("H","T"), 10,replace = TRUE)
 [1] "T" "T" "T" "T" "T" "H" "T" "T" "T" "T"


1.2 概率计算和排列组合

prod函数计算数字向量的乘积

> 1/prod(40:36)
[1] 1.266449e-08
> 1/(40*39*38*37*36)
[1] 1.266449e-08

> prod(5:1)/prod(40:36)
[1] 1.519738e-06

1.3 单组的汇总统计量(均值,标准差,方差,中位数,分位数)

> x <- rnorm(50)
> mean(x)
[1] 0.3359321
> sd(x)
[1] 0.9801387
> var(x)
[1] 0.960672
> median(x)
[1] 0.3689863
> prec <- seq(0,1,0.1)
> prec 
 [1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
> quantile(x,prec)
         0%         10%         20%         30%         40%         50%         60% 
-2.01305247 -0.84689225 -0.43141014 -0.08854443  0.18039782  0.36898631  0.50080508 
        70%         80%         90%        100% 
 0.73967146  1.24424664  1.64024475  2.22367451

如果数据中有缺失值得存在,用na.rm(not available,remove)参数来移除未知值。

> summary(quantile(x,prec))
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
-2.0130 -0.2600  0.3690  0.3198  0.9920  2.2240 

summary 对整个数据框进行汇总

1.4分布的图形展示

直方图

hist(x)

经验累积分布函数

> n <- length(x)
> plot(sort(x),(1:n)/n, type = "s", ylim = c(0,1))

Q-Q图(画出第K个最小观测值和来自标准正态分布的N个值中第K个最小观测值)

qqnorm(x)

计算经验累积分布函数的目的之一,观察数据是否能被假设成来自正态分布。如果是,则是一条直线。

1.5 分组数据的汇总统计量

> attach(red.cell.folate)
> tapply(folate, ventilation,mean)
N2O+O2,24h  N2O+O2,op     O2,24h 
  316.6250   256.4444   278.0000 
tapply 函数调用提取folate变量,根据ventilation分组,然后对每一组计算均值都用同样的方法




鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
R语言常用数据管理发布时间:2022-07-18
下一篇:
r语言 function 指定多个返回值发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap