在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
本文我们讨论期望最大化理论,应用和评估基于期望最大化的聚类。 软件包
数据我们将使用mclust软件包附带的“糖尿病”数据。
期望最大化(EM)期望最大化(EM)算法是用于找到最大似然的或在统计模型参数,其中该模型依赖于未观察到的潜变量最大后验(MAP)估计的迭代方法。期望最大化(EM)可能是无监督学习最常用的算法。 似然函数似然函数找到给定数据的最佳模型。 期望最大化(EM)算法假设我们翻转硬币并得到以下内容 - 0,1,1,0,0,1,1,0,0,1。我们可以选择伯努利分布 或者,如果我们有以厘米为单位的人的身高(男性和女性)的数据。高度遵循正常的分布,但男性(平均)比女性高,因此这表明两个高斯分布的混合模型。
贝叶斯信息准则(BIC)以糖尿病数据为例
EM的绘图命令会生成以下四个绘图: BIC值用于选择簇的数量 聚类图 分类不确定性的图表 簇的轨道图 参考 C. Fraley,AE Raftery,TB Murphy和L. Scrucca(2012年)。用于R的mclust版本4:用于基于模型的聚类,分类和密度估计的正常混合建模。华盛顿大学统计系技术报告第597号。 C. Fraley和AE Raftery(2002)。基于模型的聚类,判别分析和密度估计。Journal of the American Statistical Association 97:611:631。 C. Fraley和AE Raftery(2005年,2009年修订)。正态混合估计和基于模型的聚类的贝叶斯正则化。技术报告,华盛顿大学统计系。 C. Fraley和AE Raftery(2007)。正态混合估计和基于模型的聚类的贝叶斯正则化。Journal of Classification 24:155-181。 ▍关注我们
【服务场景】 科研项目; 公司项目外包;线上线下一对一培训;学术研究。
【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询服务
分享最新的大数据资讯,每天学习一点数据分析,让我们一起做有态度的数据人
微信客服号:lico_9e
QQ交流群:186388004
欢迎关注微信公众号,了解更多数据干货资讯!
|
请发表评论