全文链接:http://tecdat.cn/?p=18770
原文出处:拓端数据部落公众号
【视频】KMEANS 均值聚类和档次聚类:R 语言剖析生存幸福品质系数可视化实例
KMEANS 均值聚类和档次聚类:R 语言剖析生存幸福品质系数可视化实例
,时长 06:05
为了用 R 来解决网络数据,咱们应用婚礼数据集。
> nflo=network(flo,directed=FALSE)
> plot(nflo, displaylabels = TRUE,
+ boxed.labels =
+ FALSE)
下一步是 igraph。因为咱们有邻接矩阵,因而能够应用它
graph\_from\_adjacency_matrix(flo,
+ mode = "undirected")
咱们能够在两个特定节点之间取得最短门路。咱们给节点赋予适当的色彩
all\_shortest\_paths(iflo,)
> plot(iflo)
咱们还能够可视化边,须要从输入中提取边缘
> lins=c(paste(as.character(L)\[1:4\],
+ "--"
+ as.character(L)\[2:5\] sep="" ,
+ paste(as.character(L) 2:5\],
+ "--",
> E(ifl)$color=c("grey","black")\[1+EU\]
> plot(iflo)
也能够应用 D3js 可视化
> library(networkD3)
> simpleNetwork (df)
下一个问题是向网络增加一个顶点。最简略的办法是通过邻接矩阵实现概率
> flo2\["f","v"\]=1
> flo2\["v","f"\]=1
而后,咱们进行集中度测量。
目标是理解它们之间的关系。
betweenness(ilo)
> cor(base)
betw close deg eig
betw 1.0000000 0.5763487 0.8333763 0.6737162
close 0.5763487 1.0000000 0.7572778 0.7989789
deg 0.8333763 0.7572778 1.0000000 0.9404647
eig 0.6737162 0.7989789 0.9404647 1.0000000
能够应用档次聚类图来可视化集中度度量
hclust(dist( ase ,
+ method="ward")
查看集中度度量的值,查看排名
> for(i in 1:4) rbase\[,i\]=rank(base\[,i\])
在此,特征向量测度十分靠近顶点的度数。
最初,寻找聚类(以防这些家庭之间暴发和平)
> kc <- fastgreedy.community (iflo)
在这里,咱们有 3 类
最受欢迎的见解
1. 采纳 spss-modeler 的 web 简单网络对所有腧穴进行剖析
2. 用 R 语言和 python 进行社交网络中的社区检测
3.R 语言文本开掘 NASA 数据网络剖析,tf-idf 和主题建模
4. 在 R 语言中应用航空公司简单网络对疫情进行建模
5.python 附属关系图模型 基于模型的网络中密集重叠社区检测
6. 应用 Python 和 SAS Viya 剖析社交网络
7. 关联网络分析:已迁离北京外来人口的数据画像
8.情感语义网络 : 游记数据感知游览目的地形象
9. 用关联规定数据挖掘摸索药物配伍中的法则