• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

R语言学习-----2019.11.28

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

一、因子

1.变量可分为名义型(没有顺序之分的类别变量),有序型(表示一种顺序关系而非数量关系),连续型(可以呈现某个范围内的任意值,并同时表示顺序和数量)

2.类别变量和有序类别变量在R中称为因子,函数factor()以一个整数向量的形式存储类别值,要表示有序型变量,需要为函数factor()指定参数ordered = TRUE,对于字符型向量,因子的水平默认依字母顺序创建,可以通过指定levels选项来覆盖默认顺序,保证指定的水平与数据中的真实值相匹配,任何在数据中出现而未在参数中列举的数据都将被设为缺失值。

在R中无法用//解释一行语句,str(patientdata)意思是显示对象的结构。 

summary(patientdata) 表示显示对象的统计概要

summary()显示了连续型变量最小最大均值mean和各四分位数(1st Qu,median,3rd Qu,四分位数(Quartile)也称四分位点,是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。

举例: 

数据总量: 6, 47, 49, 15, 42, 41, 7, 39, 43, 40, 36

由小到大排列的结果: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49

一共11项

Q1 的位置=(11+1) × 0.25=3, Q2 的位置=(11+1)× 0.5=6, Q3的位置=(11+1) × 0.75=9

Q1 = 15,

Q2 = 40,

Q3 = 43

实例2

数据总量: 7, 15, 36, 39, 40, 41

一共6项

数列项为偶数项时,四分位数Q2为该组数列的中数,
  (n+1)/4= 7/4 =1.75,Q1在第一与第二个数字之间,
  3(n+1)/4= 21/4 =5.25, Q3在第五与第六个数字之间,

Q1 = 0.75*15+0.25*7 = 13,

Q2 = (36+39)/2= 37.5,

Q3 = 0.25*41+0.75*40 = 40.25.

1、将数据从小到大排序,计为数组a(1 to n),n代表数据的长度

2、确定四分位数的位置:b= 1+(n-1) × 0.25= 2.25,b的整数部分计为c b的小数部分计为d

计算Q1:Q1=a(c)+[a(c+1)-a(c)]*d=a(2)+[a(3)-a(2)] *0.25 =15+(36-15)×(2.25-2)=20.25

3、计算如上 Q2与Q3的求法类似,四分位差=Q3-Q1

) 

二、列表

列表是R中数据类型最为复杂的,列表中可能是若干向量、矩阵、数据框。甚至其他列表的组合。通过list()创建列表。

 

 mylist[[2]]和mylist[["ages"]]意思是输出第二个成分与输出向量ages。

注意点:

1.A&x是指数据框A中的变量x

2.必须以#作为多行注释每行的开始

3.可以把想让解释器忽略的代码放到语句if(FALSE){……}中,将FALSE改为TRUE则允许这段代码执行

4.将一个值赋给某个向量、矩阵、数组或列表中一个不存在的元素时,R将自动扩展这个数据结构以容纳新值。

5.R中没有标量。标量以单元素向量的形式出现。

6.R中的下标不从0开始,而从1开始,x[1]即表示第一个元素

7.变量无法被声明,它们在首次被赋值时生成。

数据输入:

1.使用键盘输入


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
主成分分析R语言发布时间:2022-07-18
下一篇:
R语言实现LASSO回归发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap