原文链接:http://tecdat.cn/?p=23825
简介
本文介绍了基于无限正态混合模型在r软件中的实现,用于基于模型的聚类、分类和密度估计。提供了通过EM算法对具备各种协方差构造的正态混合模型进行参数估计的函数,以及依据这些模型进行模仿的函数。此外,还包含将基于模型的分层聚类、混合散布预计的EM和贝叶斯信息准则(BIC)联合在一起的性能,用于聚类、密度估计和判别分析的综合策略。其余性能可用于显示和可视化拟合模型以及聚类、分类和密度估计后果。
聚类
head(X)
pairs(X)
plot(BIC)
summary(BIC)
summary(mod1, parameters = TRUE)
plot(mod1)
table(class, classification)
plot(mod1, what = "uncertainty")
clustICL(X)summary(ICL)
BootstrapLRT(X)
初始化
应用EM算法进行最大似然预计。EM的初始化是应用从聚类层次结构聚类中取得的分区来进行的。
hclust(X, use = "SVD"))
clustBIC(X, initialization )) # 默认
hc2
clustBIC(X, initialization )
hclust(X, model= "EEE"))
summary(BIC3)
通过合并最佳后果来更新BIC。
BIC(BIC1, BIC2, BIC3)
应用随机终点进行单变量拟合,通过创立随机会聚和合并最佳后果取得。
for(j in 1:20){ rBIC <- mclustBIC( initi )) BIC <- update(BIC, rBIC)}
clust(ga, BIC)
分类
EDDA
X <- iris\[,1:4\]head(X)
clustDA(X, class, "EDDA")
plot(mod2)
MclustDA
table(class)
head(X)
clustDA(X, class)
plot(mod3, 2)
plot(mod3, 3)
穿插验证误差
cv(mod2, nfold = 10)
unlist(cv\[3:4\])
cv(mod3, nf = 10)
unlist(cv\[3:4\])
密度估计
单变量
clust(acid)
plot(mod4, "BIC")
plot(mod4, "density", acidity)
plot(mod4, "diagnostic", "cdf")
多变量
clu(faithful)summary(mod5)
plot(mod5, "BIC")
plot(mod5, "density",faithful)
Bootstrap推理
summary(boot1, what = "se")
summary(boot1, what = "ci")
summary(boot4, what = "se")plot(boot4)
降维
聚类
plot(mod1dr, "pairs")
plot(mod1dr)
plot(mod1dr, "scatterplot")
plot(mod1dr)
分类
summary(mod2dr)plot(mod2d)
plot(mod2dr)
summary(mod3dr)plot(mod3dr)
plot(mod3dr)
应用调色板
大多数图形都应用默认的色彩。
调色板能够定义并调配给上述选项,具体如下。
options("Colors" = Palette )Pairs(iris\[,-5\], Species)
如果须要,用户能够很容易地定义本人的调色板。
参考文献
Fraley C. and Raftery A. E. (2002) Model-based clustering, discriminant analysis and density estimation, _Journal of the American Statistical Association_, 97/458, pp. 611-631.
最受欢迎的见解
1.R语言多元Logistic逻辑回归 利用案例
2.面板平滑转移回归(PSTR)剖析案例实现剖析案例实现")
3.matlab中的偏最小二乘回归(PLSR)和主成分回归(PCR)
4.R语言泊松Poisson回归模型剖析案例
5.R语言回归中的Hosmer-Lemeshow拟合优度测验
6.r语言中对LASSO回归,Ridge岭回归和Elastic Net模型实现
7.在R语言中实现Logistic逻辑回归
8.python用线性回归预测股票价格
9.R语言如何在生存剖析与Cox回归中计算IDI,NRI指标