在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
作者:丁点helper 来源: 丁点帮你 前面2篇R语言相关的文章以泰坦尼克号的数据为例,介绍了描述性统计中用到的计算操作,以及柱形图的绘制操作。今天我们继续聊聊如何在R中绘制直方图和散点图。 绘制直方图 仍使用titanic.csv这个数据。 # 导入数据 titanic <- read.csv("//Users//Desktop//titanic.csv",header = TRUE) names(titanic) # 查看titanic中的变量名 [1] "pclass" "survived" "sex" "age" "sibsp" "parch" 假设我们想对age这个变量绘制直方图,了解泰坦尼克号上乘客的年龄分布,可用hist()这个函数: hist(titanic$age) 上图中直方图标题、颜色、坐标轴名称均可调整: hist(titanic$age, col='orange', main='Passenger Age', lwd=2, xlab='Age (years)') 其中,col、main、xlab这三个命令在之前的文章中讲过;lwd为线条宽度命令,取值须为整数,默认值为1。 绘制散点图 接下来我们看看如何绘制散点图。还是老规矩,要用到的数据可通过以下方式下载: 文件名: wb.csv 链接: https://pan.baidu.com/s/1gOAuccW5i8cIW5HaPHnm8A 密码: nc5u 这是世界银行(word bank)对部分国家社会、经济、环境指标的统计数据。 # 导入数据 wb <- read.csv("//Users//Desktop//wb.csv",header = TRUE) names(wb) # 查看wb中的变量名 [1] "Country" "Code" "Population" "Rural" "GNI" "IncomeTop10" "Imports" [8] "Exports" "Military" "Cell" "Fertility66" "Fertility16" "Measles" "InfMort" [15] "LifeExp" "PM2.5" "Diesel" "CO2" "EnergyUse" "FossilPct" "Forest94" [22] "Forest14" "Deforestation" "GunTotal" "GunHomicide" "GunSuicide" "GunUnint" "GunUndet" [29] "GunsPer100" 这里我们先关注第五个变量『GNI』,其意义是人均国民收入。GNI是Gross National Income的缩写;再关注第18个变量『CO2』,其意义是人均二氧化碳排放量。 一项研究想观察人均国民收入和人均二氧化碳排放量之间存在何种关系,由于二者均为数值型变量,我们可以用散点图的方式直观感受一下: plot(wb$GNI,wb$CO2, main="CO2 vs. GNI (both per capita)", xlab="Gni per capita", ylab="CO2 per capita", col="red", pch=19) # col命令的取值还可以是数字,本例中red对应的数字是2 plot(wb$GNI,wb$CO2, main="CO2 vs. GNI (both per capita)", xlab="Gni per capita", ylab="CO2 per capita", col=2, pch=19) 上面两条代码的运行结果是一样的。wb$GNI 和 wb$CO2 分别为散点图的横轴和纵轴;pch表示点的形状,取值为整数,本例中用到的19表示圆点。 下面用一个图片来给大家介绍1-20的数字分别代表什么颜色、什么形状: plot(c(1:20),rep(1,20),col=c(1:20),pch=c(1:20),cex=2) cex表示对图中的文本或符号放大多少倍,大家可自行在R中操作,感受cex=1时图像的变化。 举个例子,col=15:黄色;pch=15:方块。在R中,可选的颜色还有很多,大家可以查看下图中的颜色名称,绘图时在col命令中输入即可。 手机用户可横屏查看效果更佳,告别大红大蓝秋裤色就靠它了~ 今天就学到这里啦,之后还有更多R绘图课程来和大家见面!
|
请发表评论