• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

R语言 random forests out-of-bag prediction

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

Created: Jun 29, 2020 12:22 PM
Updated: Jun 29, 2020 12:28 PM

https://stackoverflow.com/questions/25153276/difference-of-prediction-results-in-random-forest-model

https://stats.stackexchange.com/questions/412479/difference-between-the-out-of-bag-error-and-the-predicted-error

用R语言算random forests的时候发现,训练数据的model$predictions不等于predict(model, train_data)

这其实是一个与out-of-bag有关的合理设计。model$predictions给出的训练数据的预测值,是out-of-bag predictions,也就是对于每个point,进行预测的时候包含这个point的tree会被排除在外!random forests中每个tree训练的时候只用于2/3的数据,所以进行out-of-bag预测的时候,只会用到random forests中1/3的tree进行预测。

因此,下面的结果是不同的:

predict(model)
predict(model, newdata=dat)

第一种情况下,默认使用out-of-bag predictions。第二种数据下,由于提供了newdata(虽然是训练数据本身),dat会被当成测试数据,而不再是训练数据,因此进行的完整的预测,而不是只用1/3的tree进行预测的out-of-bag predictions


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
Python和R语言之间的抉择(二)发布时间:2022-07-18
下一篇:
《R语言编程艺术》——2.10 测试向量相等发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap