拜访【WRITE-BUG数字空间】_[内附残缺源码和文档]
图节点邻近度用于掂量图上节点绝对某一给定起始节点的绝对间隔。依据图 学习实践,邻近度较高的节点广泛具备较高的相似性。以节点分类工作为例,由 于节点邻近度的高下间接批示了图构造上节点间的类似关系,进而蕴含了各节点 的类别信息,故而能够应用节点邻近度计算结果进行神经网络的节点分类训练。
一、背景介绍
图,作为计算机科学畛域中一类重要的数据结构,提供了一种形象示意事物 之间关系的办法。图构造蕴含两类次要元素——“节点”和“边”,其中,“节点”常 被用作示意各种事物,“边”被用作示意事物之间的关系,由此形象出事实世界真 实关系的表达形式,这对咱们钻研理论生存中简单的关系网络提供了可能。只管 另一重要的数据结构“树”也含有“节点”和“边”两种元素,然而,图构造比树结构 更具灵活性。图构造中节点的平等关系和自在的连边形式,使其能够示意出事物 之间的多种关系模式,但树结构的表达能力却会因为本身定义而受到限制。比方, 咱们无奈用树结构示意一个关系闭环,也很难在事实世界中找到一个占有相对主 导位置的“根节点”。从这一点中,咱们更能看出图构造在关系网络的表白方面具 有的人造劣势。
因为图构造在关系表白方面的杰出个性,咱们常将其利用在多种理论场景中。 比方,在交通网络中,咱们罕用节点示意城市,边示意城市之间的路线,边上的 权重示意路线的长短,进而延长出图节点间的最短门路问题等,以此晋升门路规 划问题的效率。在论文援用网络中,咱们罕用节点示意论文,边示意论文之间的 援用关系,进而帮忙人们梳理论文体系、辨识重要论文等。在生命科学中的蛋白 质运输门路钻研畛域,咱们能够用节点示意蛋白质分子,用边示意蛋白质之间的 物质运输关系,进而帮忙钻研人员梳理蛋白质的流动法则,辨认具备类似性能的 蛋白质等。在社交网络中,咱们罕用节点示意用户,用边示意用户之间的好友关 系,由此刻画出用户之间的亲疏关系,进而开展社区发现、类似用户推断、趣味 产品举荐等畛域的钻研等。
近年来,依据图构造信息和节点和边上携带的特色信息进行示意学习与开掘 的问题吸引了研究者的宽泛关注,相干实践、算法和利用零碎相继涌现,钻研成 果日益丰盛。然而与此同时,海量数据规模的简单网络结构对现有的图示意学习 钻研带来了艰巨的挑战。为了能无效获取属性异质图数据所携带的构造信息和属 性、特色信息,在进行属性异质图的示意学习与开掘中,现有钻研工作广泛会在 图信息流传阶段,将初始给定的节点、边的属性和特色信息依照图构造沿邻边进 行聚合,进而失去高质量的节点示意向量,再将节点示意向量放入神经网络训练 框架中进行训练。为了失去高质量的图信息流传后果,现有办法大多会抉择一个 适宜的图节点邻近度掂量指标,通过计算图节点邻近度间接取得图信息的流传结 果。然而,现有工作应用的图节点邻近度掂量指标各不相同,不足通用的节点邻 近度计算范式来领导图信息的聚合过程,从而难以宏观了解图流传过程的外围, 也不易提出通用的图信息流传优化算法,以对立晋升所有图示意学习与开掘过程 中的图信息流传效率。
二、算法概述
图节点邻近度用于掂量图上节点绝对某一给定起始节点的绝对间隔。依据图 学习实践,邻近度较高的节点广泛具备较高的相似性。以节点分类工作为例,由 于节点邻近度的高下间接批示了图构造上节点间的类似关系,进而蕴含了各节点 的类别信息,故而能够应用节点邻近度计算结果进行神经网络的节点分类训练。 目 前 罕用的 属 性 异 质 图节点 邻 近 度掂量指标 次要包 括 : Personalized PageRank(PPR)、heat kernel PageRank(HKPR)、转移概率(transition probability)、 Katz 等。因为不同的节点邻近度掂量指标可能会影响最初的预测后果,因而,目 前的钻研工作广泛会依据具体的上游工作,抉择计算最合适的邻近度掂量指标, 以取得图构造、属性信息的集成后果。所以,设计一个通用的节点邻近度计算范 式对对立不同的邻近度计算步骤大有裨益。