原文链接：http://tecdat.cn/?p=23825

简介

本文介绍了基于无限正态混合模型在r软件中的实现，用于基于模型的聚类、分类和密度估计。提供了通过EM算法对具备各种协方差构造的正态混合模型进行参数估计的函数，以及依据这些模型进行模仿的函数。此外，还包含将基于模型的分层聚类、混合散布预计的EM和贝叶斯信息准则（BIC）联合在一起的性能，用于聚类、密度估计和判别分析的综合策略。其余性能可用于显示和可视化拟合模型以及聚类、分类和密度估计后果。

聚类

head(X)

pairs(X)

plot(BIC)

summary(BIC)

summary(mod1, parameters = TRUE)

plot(mod1)

table(class, classification)

plot(mod1, what = "uncertainty")

clustICL(X)summary(ICL)

BootstrapLRT(X)

初始化

应用EM算法进行最大似然预计。EM的初始化是应用从聚类层次结构聚类中取得的分区来进行的。

 hclust(X, use = "SVD"))

clustBIC(X, initialization )) # 默认

hc2

clustBIC(X, initialization )

hclust(X, model= "EEE"))

summary(BIC3)

通过合并最佳后果来更新BIC。

BIC(BIC1, BIC2, BIC3)

应用随机终点进行单变量拟合，通过创立随机会聚和合并最佳后果取得。

for(j in 1:20){  rBIC <- mclustBIC(                    initi ))  BIC <- update(BIC, rBIC)}

clust(ga, BIC)

分类

EDDA

X <- iris\[,1:4\]head(X)

clustDA(X, class,  "EDDA")

plot(mod2)

MclustDA

table(class)

head(X)

clustDA(X, class)

plot(mod3, 2)

plot(mod3, 3)

穿插验证误差

cv(mod2, nfold = 10)

unlist(cv\[3:4\])

cv(mod3, nf = 10)

unlist(cv\[3:4\])

密度估计

单变量

clust(acid)

plot(mod4, "BIC")

plot(mod4,  "density", acidity)

plot(mod4, "diagnostic",  "cdf")

多变量

clu(faithful)summary(mod5)

plot(mod5, "BIC")

 plot(mod5, "density",faithful)

Bootstrap推理

summary(boot1, what = "se")

summary(boot1, what = "ci")

summary(boot4, what = "se")plot(boot4)

降维

聚类

plot(mod1dr,  "pairs")

plot(mod1dr)

plot(mod1dr, "scatterplot")

plot(mod1dr)

分类

summary(mod2dr)plot(mod2d)

plot(mod2dr)

summary(mod3dr)plot(mod3dr)

plot(mod3dr)

应用调色板

大多数图形都应用默认的色彩。

调色板能够定义并调配给上述选项，具体如下。

options("Colors" = Palette )Pairs(iris\[,-5\], Species)

如果须要，用户能够很容易地定义本人的调色板。

参考文献

Fraley C. and Raftery A. E. (2002) Model-based clustering, discriminant analysis and density estimation, _Journal of the American Statistical Association_, 97/458, pp. 611-631.

最受欢迎的见解

1.R语言多元Logistic逻辑回归利用案例

2.面板平滑转移回归(PSTR)剖析案例实现剖析案例实现")

3.matlab中的偏最小二乘回归（PLSR）和主成分回归（PCR）

4.R语言泊松Poisson回归模型剖析案例

5.R语言回归中的Hosmer-Lemeshow拟合优度测验

6.r语言中对LASSO回归，Ridge岭回归和Elastic Net模型实现

7.在R语言中实现Logistic逻辑回归

8.python用线性回归预测股票价格

9.R语言如何在生存剖析与Cox回归中计算IDI，NRI指标