• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

R语言的学习(四)

原作者: [db:作者] 来自: [db:来源] 收藏 邀请
一、直方图
hist(x, breaks = "Sturges", freq = NULL, probability = !freq, include.lowest = TRUE, right = TRUE, density = NULL, angle = 45, col = NULL, border = NULL, main = paste("Histogram of" , xname), xlim = range(breaks), ylim = NULL, xlab = xname, ylab, axes = TRUE, plot = TRUE, labels = FALSE, nclass = NULL, warn.unused = TRUE, ...)
二、核密度函数
与直方图相配套的是核密度估计函数density(),作用是已知其样本,估计其密度
使用方法:
density(x,bw="nrdo",adjust=1,kernel=c("guassian","epanechnikov","rectangular","triangular","biweight","cosine","optosine"),
windoe=kernel,width,
give.Rkern=FALSE,
n=512,from,to,cut=3,na.rm=FALSE)
其中x是由样本构成的向量,bw是带宽,当bw为省略值时,R软件会画出光滑的曲线

核密度估计(kernel density estimation)是在概率论中用来估计未知的密度函数,属於非参数检验方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基于数据集密度函数聚类算法提出修订的核密度估计方法。

 

w<-c(75.0,64.0,47.4,66.9,62.2,66.2,58.7,63.5,66.6,64.0,57.0,69.0,56.9,50.0,72.0)
> hist(w,freq=FALSE)
> lines(density(w),col="blue")
> x<-44:76
> lines(x,dnorm(x,mean(w),sd(w)),col="red")

 

freq:TRUE是绘出频率直方图

       counts是绘出频率直方图

       FALSE是绘出密度直方图

蓝色的线是核密度估计曲线,红色的线是正态分布的概率密度曲线

三、经验分布

直方图的制作适合于总体为连续分布的场合,对于一般的总体分布,若要估计它的 总体分布函数F(x),可用经验分布函数做估计

用法:

ecdf(x)

plot(x,verticals=FALSE)

verticals为FALSE为不画竖线,为TRUE为画竖线,

ex:

plot(ecdf(w),verticals=TRUE,do.p=FALSE)
> x<-44:78
> lines(x,pnorm(x,mean(w),sd(w)))
do.p为FALSE代表不画点处的记号,TRUE或缺省画记号

四QQ图

不论是直方还是经验分布图,要从比较上鉴别样本是否近似于某种类型的分布是困难的,QQ图可以帮助我们鉴别样本的分布是否近似于某种类型的分布

R软件中提供了画正态QQ图和相应直线的方法

qqnorm(y,...)

qqnorm(y,ylim,main="Normal Q-Q plot",

            xlab="Theoretical Quantiles",

            ylab="Sample Quantiles",plot.it=TRUE,

            datax=FALSE,...)

qqline(y,datax=FALSE,...)

qqplot(x,y,plot.it=TRUE,xlab=deparse(substitute(x)),

          ylab=deparse(substitute(y)),...)

#deparse:Turn unevaluated expressions into character strings.

EX:

w
[1] 75.0 64.0 47.4 66.9 62.2 66.2 58.7 63.5 66.6 64.0 57.0 69.0 56.9 50.0
[15] 72.0
> qqnorm(w);qqline(w)

 

从正态QQ图来看,样本的数据基本可以看成来自正态总体

对于对数正态,指数等分布也可以做相应的QQ图,用以鉴别数据知否来自某一类型的总体分布

 


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
用R语言实现密度聚类dbscan发布时间:2022-07-18
下一篇:
R语言-数据整形之reshape2包发布时间:2022-07-18
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap