• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

《R语言与数据挖掘最佳实践和经典案例》—— 1.3 数据集

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

本节书摘来自华章出版社《R语言与数据挖掘最佳实践和经典案例》一 书中的第1章,第1.3节,作者:(澳)Yanchang Zhao,更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.3 数据集

本节简单地介绍本书中将要使用到的数据集。

1.3.1 iris数据集

在许多的科研著作中都在iris数据集上做分类操作。该数据集由3种不同类型的鸢尾花的50个样本数据构成 [Frank and Asuncion,2010]。其中的一个种类与另外两个种类是线性可分离的,后两个种类是非线性可分离的。这个数据集包含了5个属性:
Sepal.Length(花萼长度),单位是cm。
Sepal.Width(花萼宽度),单位是cm。
Petal.Length(花瓣长度),单位是cm。
Petal.Width(花瓣宽度),单位是cm。
种类:Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),以及Iris Virginica(维吉尼亚鸢尾)。

1.3.2 Bodyfat数据集

Bodyfat数据集由mboost包[Hothorn et al.,2012]提供。该数据集包含71行,每一行代表一个客户的信息。数据集包含10列数值型数据。
age:年龄。
DEXfat:以DXA计算的体脂重,响应变量。
waistcirc:腰围。
hipcirc:臀围。
elbowbreadth:肘宽。
kneebreadth:膝宽。
anthro3a:三项人体测量的对数和。
anthro3b:三项人体测量的对数和。
anthro3c:三项人体测量的对数和。
anthro4:三项人体测量的对数和。
DEXfat的值可通过其他的变量预测得到。


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
《R语言数据挖掘》——2.4 序列数据集挖掘发布时间:2022-07-18
下一篇:
R语言用rle,svm和rpart进行时间序列预测发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap