最近,又有一款 Python 可视化工具火了。
这一次,性能是针对 图聚类 问题的社群构造进行检测、可视化。
该项目标帖子在 reddit 上一经公布,就被顶到了“机器学习板块”的 榜首。
一起来看看它到底都能用来做什么吧~
性能亮点
这款工具叫作 communities,是一个 Python 库,用于图聚类问题的社群构造检测。
它反对 多种算法,包含:
- Louvain 算法;
- Girvan-Newman 算法;
- 档次聚类算法;
- 光谱聚类算法;
- Bron-Kerbosch 算法。
更赞的是,communities 还能够实现这些 算法的可视化。
具体理解一下~
导入算法并插入矩阵
这里以 Louvain 算法 为例。
这是一种基于模块度的社群发现算法,也是贪婪算法。
它依据顶点的共享边将顶点排列成社群构造,也就是说,它将节点分为几个社群,每个社群之间共享很少的连贯,然而同一社群的节点之间共享许多连贯。
最终,让整个社群网络呈现出一种模块汇集的构造,实现整个社群网络的模块度的最大化。
所以首先,咱们须要构建一个示意无向图的 邻接矩阵,能够加权,也能够不加权,矩阵为 2Dnumpy 数组。
n* n 矩阵则示意有 n 个节点,矩阵的每个地位别离示意各节点之间边的关系,有边则为 1,没有边则为 0。
而后,只需从 communities.algorithms 中导入算法并插入矩阵。
import numpy as np
from communities.algorithms import louvain_method
adj_matrix = np.array([[0, 1, 1, 0, 0, 0],
[1, 0, 1, 0, 0, 0],
[1, 1, 0, 1, 0, 0],
[0, 0, 1, 0, 1, 1],
[0, 0, 0, 1, 0, 1],
[0, 0, 0, 1, 1, 0]])
communities, _ = louvain_method(adj_matrix)
# >>> [{0, 1, 2}, {3, 4, 5}]
接下来输入社群列表,每个社群即为一组节点。
实现可视化,并进行色彩编码
利用 communities 将图进行可视化,将节点分到社群中并进行色彩编码,还能够抉择深色或浅色背景、保留图片、抉择图片的分辨率等等。
draw_communities(adj_matrix : numpy.ndarray, communities : list, dark : bool = False, filename : str = None, seed : int = 1)
其中各参数的具体含意为:
- adj_matrix (numpy.ndarray):图的邻接矩阵;
- dark (bool, optional (default=False)):如果为 True, 则绘图为深色背景,否则为浅色背景;
- filename (str or None, optional (default=None)):通过 filename 门路能够将图另存为 PNG 格局; 设置 None 则是用交互方式显示图;
- dpi (int or None, optional (default=None)):每英寸的点数,管制图像的分辨率;
- seed (int, optional (default=2)):随机种子。
具体到 Louvain 算法的可视化,代码是这样的:
from communities.algorithms import louvain_method
from communities.visualization import draw_communities
adj_matrix = [...]
communities, frames = louvain_method(adj_matrix)
draw_communities(adj_matrix, communities)
动画出现算法
communities 还能够动画出现节点调配到社群的过程。
louvain_animation(adj_matrix : numpy.ndarray, frames : list, dark : bool = False, duration : int = 15, filename : str = None, dpi : int = None, seed : int = 2)
其中各参数的含意如下:
- adj_matrix (numpy.ndarray):图的邻接矩阵;
- frames (list):算法每次迭代的字典列表;
- 每个字典都有俩个键:“C”蕴含节点到社群的查找表,“Q”示意图的模块度数值;
- 此字典列表是 louvain_method 的第二个返回值;
- dark (bool, optional (default=False)):如果为 True, 则动画为深色背景和配色计划,否则为浅色计划;
- duration (int, optional (default=15)):动画所需的持续时间,以秒为单位;
- filename (str or None, optional (default=None)):通过 filename 门路将动画存为 GIF;设置 None 则以交互方式展现动画;
- dpi (int or None, optional (default=None)):每英寸点数,管制动画的分辨率;
- seed (int, optional (default=2)):随机种子。
例如,空手道俱乐部网络中 Louvain 算法的动画出现:
from communities.algorithms import louvain_method
from communities.visualization import louvain_animation
adj_matrix = [...]
communities, frames = louvain_method(adj_matrix)
louvain_animation(adj_matrix, frames)
咱们能够看到 Louvain 算法的动静过程:
- 首先扫描数据中的所有节点,将每个节点看做一个独立的社群;
- 接下来,遍历每个节点的街坊节点,判断是否将该节点退出街坊节点所在的社群,以晋升模块度;
- 这一过程反复迭代,直到每一个节点的社群归属稳固;
- 最初,将所有在同一个社群的节点压缩成一个新节点,计算新节点的权重,直到整个图的模块度稳固。
大家能够通过文末链接,自行尝试一下其余算法~
此外,它还能够用于社群间邻接矩阵、拉普拉斯矩阵以及模块度矩阵等。
对于这款工具,不少网友收回“awesome”、“really cool!”等花式赞叹,示意正是本人须要的。
当然,也有网友提出疑难,例如:是否能够指定执行的迭代次数(例如:提前进行)?
开发者对此示意:不能,然而对于某些算法,能够指定要将图形划分为多少个社群。
作者简介
我的项目开发者 Jonathan Shobrook,他目前是美国一家电商公司的软件工程师。
之前 GitHub 上的热门我的项目 Rebound,也是出自他手,曾经取得 3.5k 星。
更多信息可戳下方链接理解~
相干链接:
[1]https://github.com/shobrook/c…
[2]https://www.reddit.com/r/Mach…
开源前哨
日常分享热门、乏味和实用的开源我的项目。参加保护 10 万 + Star 的开源技术资源库,包含:Python、Java、C/C++、Go、JS、CSS、Node.js、PHP、.NET 等。