原文链接： http://tecdat.cn/?p=20960

为了阐明档次聚类技术和k-均值，我应用了了城市温度数据集，其中包含几个城市的月平均气温。

咱们有15个城市，每月进行一次观测

boxplot(temp[,1:12],main="月平均温度")

因为方差看起来相当稳固，咱们不会将这里的变量“标准化”，

> apply(月份,2,sd)

为了失去一个档次聚类分析，应用实例

 hclust(dist , method = "ward")

另一种抉择是应用

 > plot(h2)

在这里，咱们用主成分剖析将察看后果可视化。咱们这里还有一个主动抉择类的数目，这里是3个。咱们能够失去组的形容

或间接

 cutree(cah,3)

咱们也能够本人可视化这些类，

 PCA(X,scale.unit=FALSE)
 plot(  ind$coord[,1:2],col="white")
 text( ind$coord[,1],acp$ind$coord[,2],

能够绘制出这些簇的中心点

 > points(PT$Dim.1,PT$Dim.2,pch=19)

如果咱们在这些核心四周增加_Voronoi_集，咱们看到的是两头的点，恰好是三个区域的交点

vormo(PT$Dim.1,PT$Dim.2)
plot(V,add=TRUE)

要可视化这些区域，请应用_Voronoi图_，它又叫泰森多边形或Dirichlet图，它是由一组由连贯两邻点直线的垂直平分线组成的间断多边形组成。

 p=function(x,y){
+   which.min((PT$Dim.1-x)^2+(PT$Dim.2-y)^2)
image(vx,vy,z,col=c(rgb(1,0,0,.2),

实际上，这三组（和这三个区域）也是咱们用k-均值算法失去的，

kmeans(coord[,1:2],3)

K-means clustering 
with 3 clusters of sizes 3, 7, 5

因为咱们有一些空间数据，咱们能够在地图上把它们可视化

points(Long,Lati,col=groups.3)

或者，为了可视化这些区域，应用

 for(i in 1:3) 
+ Ellipse( Long[groups.3==i],

最受欢迎的见解

1.R语言k-Shape算法股票价格工夫序列聚类

2.R语言中不同类型的聚类办法比拟

3.R语言对用电负荷工夫序列数据进行K-medoids聚类建模和GAM回归

4.r语言鸢尾花iris数据集的档次聚类

5.Python Monte Carlo K-Means聚类实战

6.用R进行网站评论文本开掘聚类

7.用于NLP的Python：应用Keras的多标签文本LSTM神经网络

8.R语言对MNIST数据集剖析摸索手写数字分类数据

9.R语言基于Keras的小数据集深度学习图像分类

关于算法:R语言基于温度对城市层次聚类kmean聚类主成分分析和Voronoi图可视化