主要4中软件包
stas:主要包含基本统计函数。
cluster:用于聚类分析。
fpc:含聚类算法函数(固定聚类、线性回归聚类等)。
mclust:处理高斯分布混合模型,通过EM算法实现聚类、分类及密度估计等。
kmeans()函数用法:
kmeans(x,centers,iter.max=10,nstart=1,algorithm=c("Hartigan-Wong","Lloyd","For-gy","MacQueen")
library("xlsx")
accountinfo <- read.xlsx("account.xlsx",1,header = TRUE) #载入数据
dim(accountinfo)
head(accountinfo)
account_km <- kmeans(accountinfo[,-1],centers = 3) #自定义为3类
print(account_km) #输出结果
3类样本数分别为:43002,12509,2294
中心点坐标为:
1 1.468350 102.2073
2 4.070589 396.2660
3 8.369224 937.3692
组内平方和为:197660145 152158338 254995794
请发表评论