关于数据挖掘:视频复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化数据分享附代码数据

39次阅读

共计 2596 个字符,预计需要花费 7 分钟才能阅读完成。

全文链接:http://tecdat.cn/?p=18770 

最近咱们被客户要求撰写对于简单网络分析的钻研报告,包含一些图形和统计输入。

为了用 R 来解决网络数据,咱们应用婚礼数据集 查看文末理解数据获取形式

CNA 钻研和利用爆炸式增长的突出起因是两个因素 – 一个是便宜而弱小的计算机的可用性,使在数学、物理和社会科学方面承受过高级培训的钻研人员和科学家可能进行一流的钻研;另一个因素是是人类社会、行为、生物、金融和技术方面一直减少的复杂性。

网络是离散数据的组织和示意的关系模式。对于网络的两个最重要的概念是实体和它们之间的关系。实体称为节点,关系称为边。网络节点和边是高级形象,对于大多数网络来说,它们的实在性质并不重要。当必要时,咱们通过增加属性来示意节点和边。关系或边通常波及两个离散的实体或节点,只管实体能够与本身存在关系,这种关系称为自反关系。

在探讨简单网络的真正样子之前,让咱们先谈谈有时称为 经典网络的根本简单网络。 经典网络的一个例子是线性网络——咱们生命的工夫线,每个生命事件(例如“出世”、“第一次走路”、“学校毕业”、“婚姻”和最终的“死亡”)都是一个实体至多一个属性是工夫。“产生在之后”是这种状况下的关系,因为一条边将两个事件连贯在一起,一个事件紧接着另一个事件产生。这个网络之所以被认为是简略的,是因为它具备规定的构造,而不是因为它很小。

线性工夫线


点击题目查阅往期内容

航空公司简单网络对疫情进行建模

左右滑动查看更多

01

02

03

04

**
**

简单的网络具备非平庸的构造,它既不是网格也不是树。

 

因为没有全局管制的扩散过程,这些简单的网络产生在自然界和人造世界中。此类网络的一些代表包含:

  1. 社交网络:家人和敌人、Twitter 和 instagram 追随者等。
  2. 文化网络: 宗教网络、语言家族等。
  3. 技术网络: 交通和通信零碎等……
  4. 金融网络: 华尔街市场、国际贸易等。
  5. 生物网络: 基因 / 蛋白质相互作用、疾病风行等。

R 语言简单网络分析:聚类(社区检测)和可视化

为了用 R 来解决网络数据,咱们应用婚礼数据集 查看文末理解数据获取形式

 nflo=network(flo,directed=FALSE)

 plot(nflo, displaylabels = TRUE,+ boxed.labels =+ FALSE)

下一步是 igraph。因为咱们有邻接矩阵,因而能够应用它

graph_from_adjacency_matrix(flo,

+ mode = "undirected")

咱们能够在两个特定节点之间取得最短门路。咱们给节点赋予适当的色彩

 all_shortest_paths(iflo,)

 

 

> plot(iflo)

咱们还能够可视化边,须要从输入中提取边缘

> lins=c(paste(as.character(L)[1:4],

+ "--" 

+ as.character(L)[2:5]  sep="" ,

+ paste(as.character(L) 2:5],

+ "--",

 

> E(ifl)$color=c("grey","black")[1+EU]> plot(iflo)

也能够应用 D3js 可视化

> library(networkD3)

> simpleNetwork (df)

下一个问题是向网络增加一个顶点。最简略的办法是通过邻接矩阵实现概率

> flo2["f","v"]=1> flo2["v","f"]=1

而后,咱们进行集中度测量。

目标是理解它们之间的关系。

 betweenness(ilo)

 

> cor(base)

betw close deg eig

betw 1.0000000 0.5763487 0.8333763 0.6737162close 0.5763487 1.0000000 0.7572778 0.7989789deg 0.8333763 0.7572778 1.0000000 0.9404647eig 0.6737162 0.7989789 0.9404647 1.0000000

能够应用档次聚类图来可视化集中度度量

hclust(dist( ase  ,

+ method="ward")

相干视频

**

拓端

,赞 20

查看集中度度量的值,查看排名

 > for(i in 1:4) rbase[,i]=rank(base[,i])

在此,特征向量测度十分靠近顶点的度数。

最初,寻找聚类(以防这些家庭之间暴发和平)

> kc <- fastgreedy.community (iflo)

在这里,咱们有 3 类

点击文末 “浏览原文”

获取全文残缺材料。

本文选自《简单网络分析 CNA 简介与 R 语言对婚礼数据聚类(社区检测)和可视化》。

点击题目查阅往期内容

R 语言公交地铁路线进出站数据挖掘网络图可视化
混合图形模型 MGM 的网络可预测性剖析
网络社区检测(社群发现)剖析女性加入社交活动和社区节点着色可视化
用航空公司简单网络对疫情进行建模
R 语言社区发现算法检测心理学简单网络:spinglass、探索性图剖析 walktrap 算法与可视化
R 语言简单网络分析:聚类(社区检测)和可视化
应用 Python 和 SAS Viya 剖析社交网络
R 语言用 igraph 绘制网络图可视化
在 R 语言中应用航空公司简单网络对疫情进行建模
R 语言用相干网络图可视化剖析汽车配置和饮酒习惯
R 语言公交地铁路线进出站数据挖掘网络图可视化
python 对网络图 networkx 进行社区检测和黑白绘图 R 语言推特 twitter 网络转发可视化剖析
R 语言简单网络分析:聚类(社区检测)和可视化
R 语言混合图形模型 MGM 的网络可预测性剖析
R 语言应用自组织映射神经网络(SOM)进行客户细分
R 语言网络分析友情悖论案例
R 语言网络和网络流的可视化实际:通勤者流动网络
R 语言最大流最小割定理和最短门路算法剖析交通网络流量拥挤问题
R 语言公交地铁路线网络图实现数据挖掘实战
R 软件 SIR 模型网络结构扩散过程模仿
通过 SAS 网络分析对人口迁移进行可视化剖析
python 附属关系图模型: 基于模型的网络中密集重叠社区检测办法
应用 Python 和 SAS Viya 剖析社交网络
用 R 语言和 python 进行社交网络中的社区检测
python 图工具中基于随机块模型动静网络社团检测
在 R 语言中应用航空公司简单网络对疫情进行建模
采纳 SPSS Modeler 的 Web 简单网络对所有腧穴进行剖析

正文完
 0