关于算法:r语言有限正态混合模型EM算法的分层聚类分类和密度估计

40次阅读

共计 1942 个字符,预计需要花费 5 分钟才能阅读完成。

原文链接:http://tecdat.cn/?p=23825

简介

本文介绍了基于无限正态混合模型在 r 软件中的实现,用于基于模型的聚类、分类和密度估计。提供了通过 EM 算法对具备各种协方差构造的正态混合模型进行参数估计的函数,以及依据这些模型进行模仿的函数。此外,还包含将基于模型的分层聚类、混合散布预计的 EM 和贝叶斯信息准则(BIC)联合在一起的性能,用于聚类、密度估计和判别分析的综合策略。其余性能可用于显示和可视化拟合模型以及聚类、分类和密度估计后果。

聚类

head(X)
pairs(X)

plot(BIC)

summary(BIC)

summary(mod1, parameters = TRUE)

 

 

plot(mod1)

table(class, classification)
plot(mod1, what = "uncertainty")

clustICL(X)
summary(ICL)

BootstrapLRT(X)

初始化

应用 EM 算法进行最大似然预计。EM 的初始化是应用从聚类层次结构聚类中取得的分区来进行的。

 hclust(X, use = "SVD"))

clustBIC(X, initialization)) # 默认

 

hc2

clustBIC(X, initialization)

 

hclust(X, model= "EEE"))

 

summary(BIC3)

 

通过合并最佳后果来更新 BIC。

BIC(BIC1, BIC2, BIC3)

应用随机终点进行单变量拟合,通过创立随机会聚和合并最佳后果取得。

for(j in 1:20)
{
  rBIC <- mclustBIC(initi))
  BIC <- update(BIC, rBIC)
}

clust(ga, BIC)

分类

EDDA

X <- iris\[,1:4\]
head(X)

clustDA(X, class,  "EDDA")

plot(mod2)

MclustDA

table(class)

head(X)

clustDA(X, class)

plot(mod3, 2)

 

plot(mod3, 3)

穿插验证误差

cv(mod2, nfold = 10)

unlist(cv\[3:4\])

 

cv(mod3, nf = 10)

 

unlist(cv\[3:4\])

密度估计

单变量

clust(acid)

 

plot(mod4, "BIC")

plot(mod4,  "density", acidity)

plot(mod4, "diagnostic",  "cdf")

多变量

clu(faithful)
summary(mod5)

plot(mod5, "BIC")

 

plot(mod5, "density",faithful)

Bootstrap 推理

summary(boot1, what = "se")

 

 

summary(boot1, what = "ci")

 

 

summary(boot4, what = "se")

plot(boot4)

降维

聚类

plot(mod1dr,  "pairs")

plot(mod1dr)

plot(mod1dr, "scatterplot")

plot(mod1dr)

分类

summary(mod2dr)

plot(mod2d)

plot(mod2dr)

summary(mod3dr)

plot(mod3dr)

plot(mod3dr)

应用调色板

大多数图形都应用默认的色彩。

调色板能够定义并调配给上述选项,具体如下。

options("Colors" = Palette)
Pairs(iris\[,-5\], Species)

如果须要,用户能够很容易地定义本人的调色板。

参考文献

Fraley C. and Raftery A. E. (2002) Model-based clustering, discriminant analysis and density estimation, _Journal of the American Statistical Association_, 97/458, pp. 611-631.


 

最受欢迎的见解

1.R 语言多元 Logistic 逻辑回归 利用案例

2. 面板平滑转移回归 (PSTR) 剖析案例实现剖析案例实现 ”)

3.matlab 中的偏最小二乘回归(PLSR)和主成分回归(PCR)

4.R 语言泊松 Poisson 回归模型剖析案例

5.R 语言回归中的 Hosmer-Lemeshow 拟合优度测验

6.r 语言中对 LASSO 回归,Ridge 岭回归和 Elastic Net 模型实现

7. 在 R 语言中实现 Logistic 逻辑回归

8.python 用线性回归预测股票价格

9.R 语言如何在生存剖析与 Cox 回归中计算 IDI,NRI 指标

正文完
 0