乐趣区

关于程序员:通用可扩展的图卷积神经网络

拜访【WRITE-BUG 数字空间】_[内附残缺源码和文档]
图节点邻近度用于掂量图上节点绝对某一给定起始节点的绝对间隔。依据图 学习实践,邻近度较高的节点广泛具备较高的相似性。以节点分类工作为例,由 于节点邻近度的高下间接批示了图构造上节点间的类似关系,进而蕴含了各节点 的类别信息,故而能够应用节点邻近度计算结果进行神经网络的节点分类训练。
一、背景介绍
图,作为计算机科学畛域中一类重要的数据结构,提供了一种形象示意事物 之间关系的办法。图构造蕴含两类次要元素——“节点”和“边”,其中,“节点”常 被用作示意各种事物,“边”被用作示意事物之间的关系,由此形象出事实世界真 实关系的表达形式,这对咱们钻研理论生存中简单的关系网络提供了可能。只管 另一重要的数据结构“树”也含有“节点”和“边”两种元素,然而,图构造比树结构 更具灵活性。图构造中节点的平等关系和自在的连边形式,使其能够示意出事物 之间的多种关系模式,但树结构的表达能力却会因为本身定义而受到限制。比方,咱们无奈用树结构示意一个关系闭环,也很难在事实世界中找到一个占有相对主 导位置的“根节点”。从这一点中,咱们更能看出图构造在关系网络的表白方面具 有的人造劣势。
因为图构造在关系表白方面的杰出个性,咱们常将其利用在多种理论场景中。比方,在交通网络中,咱们罕用节点示意城市,边示意城市之间的路线,边上的 权重示意路线的长短,进而延长出图节点间的最短门路问题等,以此晋升门路规 划问题的效率。在论文援用网络中,咱们罕用节点示意论文,边示意论文之间的 援用关系,进而帮忙人们梳理论文体系、辨识重要论文等。在生命科学中的蛋白 质运输门路钻研畛域,咱们能够用节点示意蛋白质分子,用边示意蛋白质之间的 物质运输关系,进而帮忙钻研人员梳理蛋白质的流动法则,辨认具备类似性能的 蛋白质等。在社交网络中,咱们罕用节点示意用户,用边示意用户之间的好友关 系,由此刻画出用户之间的亲疏关系,进而开展社区发现、类似用户推断、趣味 产品举荐等畛域的钻研等。
近年来,依据图构造信息和节点和边上携带的特色信息进行示意学习与开掘 的问题吸引了研究者的宽泛关注,相干实践、算法和利用零碎相继涌现,钻研成 果日益丰盛。然而与此同时,海量数据规模的简单网络结构对现有的图示意学习 钻研带来了艰巨的挑战。为了能无效获取属性异质图数据所携带的构造信息和属 性、特色信息,在进行属性异质图的示意学习与开掘中,现有钻研工作广泛会在 图信息流传阶段,将初始给定的节点、边的属性和特色信息依照图构造沿邻边进 行聚合,进而失去高质量的节点示意向量,再将节点示意向量放入神经网络训练 框架中进行训练。为了失去高质量的图信息流传后果,现有办法大多会抉择一个 适宜的图节点邻近度掂量指标,通过计算图节点邻近度间接取得图信息的流传结 果。然而,现有工作应用的图节点邻近度掂量指标各不相同,不足通用的节点邻 近度计算范式来领导图信息的聚合过程,从而难以宏观了解图流传过程的外围,也不易提出通用的图信息流传优化算法,以对立晋升所有图示意学习与开掘过程 中的图信息流传效率。
二、算法概述
图节点邻近度用于掂量图上节点绝对某一给定起始节点的绝对间隔。依据图 学习实践,邻近度较高的节点广泛具备较高的相似性。以节点分类工作为例,由 于节点邻近度的高下间接批示了图构造上节点间的类似关系,进而蕴含了各节点 的类别信息,故而能够应用节点邻近度计算结果进行神经网络的节点分类训练。目 前 罕用的 属 性 异 质 图节点 邻 近 度掂量指标 次要包 括:Personalized PageRank(PPR)、heat kernel PageRank(HKPR)、转移概率(transition probability)、Katz 等。因为不同的节点邻近度掂量指标可能会影响最初的预测后果,因而,目 前的钻研工作广泛会依据具体的上游工作,抉择计算最合适的邻近度掂量指标,以取得图构造、属性信息的集成后果。所以,设计一个通用的节点邻近度计算范 式对对立不同的邻近度计算步骤大有裨益。

退出移动版