柱状图:
##利用ggplot2包
library(ggplot2)
with(mpg,table(class,year))
p <- ggplot(data=mpg,aes(x=class,fill=factor(year)))
p + geom_bar(position='dodge')
#dodge将不同年份数据并列放置
p + geom_bar(position='stack') #stack将不同年份数据堆叠放置,默认处理方式
p + geom_bar(position='fill') #展示方式与stack类似,但Y轴不再是计数,而是百分比显示
p + geom_bar(position='identity',alpha=0.3) #identity不做任何改变直接显示,需要设置透明度才可看得清
散点图:
library(ggplot2)
p <- ggplot(mpg, aes(cty, hwy))
p1 <- p + geom_point(aes(colour = factor(year),shape = factor(year), size = displ), alpha = 0.6)
print(p1)
饼图:
slices<-c(10,12,4,16,8)
lbls<-c('US','UK','Australia','Germany','France')
pie(slices,labels = lbls,main='Simple Pie Chart')
直方图:
在x轴将值域分割为一定数量的组,在Y轴显示相应值的频数,展示了连续型变量的分布
Freq = T, 纵轴为频数
Freq = F, 纵轴为密度
hist(mtcars$mpg,freq=F,breaks=12,col='red',xlab = 'Miles Per Gallon',main = 'Colored histogram with 12 bins')
hist(mtcars$mpg,freq=T,breaks=12,col='red',xlab = 'Miles Per Gallon',main = 'Colored histogram with 12 bins')
密度曲线图:
在频率分布直方图中,当样本容量充分放大时,图中的组距就会充分缩短,这时图中的阶梯折线就会演变成一条光滑的曲线,这条曲线就称为总体的密度分布曲线。
d<-density(mtcars$mpg)
plot(d,main='Kernel Density of Miles Per Gallon')
箱线图:
箱线图需要用到统计学的四分位数(Quartile)的概念,所谓四分位数,就是把组中所有数据由小到大排列并分成四等份,处于三个分割点位置的数字就是四分位数。第一四分位数(Q1),又称“较小四分位数”或“下四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。第二四分位数(Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。第三四分位数(Q3),又称“较大四分位数”或“上四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。第三四分位数与第一四分位数的差距又称四分位间距(InterQuartile Range,IQR)。
boxplot(mpg~cyl,data = mtcars,main='Car Mileage Data',xlab='Number of Cylinders',ylab='Miles Per Gallon')
violet图:
小提琴图中的白色的点表示中位数,黑色的框表示IQR,细黑线表示须,小提琴的胖瘦表示分布密度。
library(vioplot)
x1 <- mtcars$mpg[cyl==4]
x2 <- mtcars$mpg[cyl==6]
x3 <- mtcars$mpg[cyl==8]
vioplot(x1,x2,x3,names=c("4 Cylinders","6 Cylinders","8 Cylinders"),col="gold")
title("Violin Plot of MPG by Number of Cylinders")
|
请发表评论