上集回顾
ok,延续上一节的节奏,快速把上节的题做了以便用来复习,然后继续我们的数据输入剩下的内容。上一节使用c函数和vector函数输入向量、使用cbind(rbind)函数和matrix函数结合矩阵数据。这一节学习剩下的两种结合数据方式以及数据的载入方法。
结合数据
使用data.frame函数结合数据 变量 = data.frame(列1=向量1,列2=向量2........)
和cbind以及matrix函数类似,使用数据框可以结合具有相同长度的变量,而数据库的每一行就包含有同一样本的不同观察值。其优点是可以在不影响原始数据的基础上改变数据。
数据框和cbind以及matrix函数不同在于,可以结合不同类型的数据。注意:数据框中的数据不依赖于赋值的变量,也就是删除掉赋值时的变量也不会影响数据框的数据。
数据框的使用情况:首先向R输入数据(一般载入),然后对数据进行处理,再将数据放入数据框中以便后面的分析。
使用list函数结合数据 变量 = list(数据1=变量1,数据2=变量2)
前面用到的结合数据方式都是生成一个列表,每一行记录代表一个样本单元(比如一只鸟的各种信息)。而list函数不同,它可以放入任意数量的各种各样的变量,比如向量、矩阵、字符串等。几乎所有的R中函数的输出结果都是保存在列表中。注意:在list函数中不能使用“<-“符号,只能用”=”。
习题五:使用流行病学数据练习data.frame函数和list函数的应用
生成包含流行病所有数据的数据框,并将长度数据值的均方根加到这个数据框中,用list也实现同样功能,并比较异同。 二者异同:二者都是将一系列任意类型的变量输入,最显著的不同在于frame框架中每一行是一个样本单元,而list列表中是按照输入的变量进行存放,每一行都是各个变量包含的数据,而不是样本的单元。
学习感悟:晚上有别的事情耽误了学习R,不过做了基本的学习,在复习的基础上学习了很重要的frame框架和list列表,在后续实际上的大数据处理中用处极大。剩下的数据载入部分留到下节继续了,争取也了解一些数据访问上的内容。加油~
|
请发表评论