在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
一、对数据的分布进行初步判断 1.1 原理 对于不同的分布,有特定的偏度(skewness)和峰度(kurtosis),正态分布、均匀分布、逻辑斯谛分布、指数分布的偏度和峰度都是特定的值,在偏度-峰度图中是特定的点,而伽马分布和对数正态分布在偏度-峰度图中是一条直线,贝塔分布在偏度-峰度图中是一片区域。因此可以通过未知分布的偏度峰度值(在图中是一个观察点),与各种分布的偏度峰度点(线、区域)进行对比,判断未知分布数据大致可能的一个或几个分布。 1.2 R代码 library(fitdistrplus) descdist(data, discrete = FALSE, boot = NULL, method = "unbiased",
二、进一步判断数据对某分布的服从程度 2.1 原理 通过maximum likelihood (mle), moment matching (mme), quantile matching (qme) or maximizing goodness-of-fit estimation (mge)几种方法将单变量分布拟合为非截尾数据。 2.2 R代码 fitdist(data, distr, method = c("mle", "mme", "qme", "mge"),
三、实例 例一 引入《判断数据是否服从某一分布(一)》中例二。 数据: library(fitdistrplus)
由图可知,观察点接近的分布有gamma分布和指数分布。 首先判断数据对gamma分布的服从程度: fitdist(x, "gamma") 再判断对指数分布的服从程度: fitdist(x, "exp")
由上述结果可知,指数分布的Std.Error(标准误)更小。所以数据更服从指数分布。
参考文献 https://cran.r-project.org/web/packages/fitdistrplus/fitdistrplus.pdf |
请发表评论