关于前端:推荐场景太大太复杂搞不动快来试试-PGLBox

图神经网络（Graph Neural Network，GNN）是近年来呈现的一种利用深度学习间接对图构造数据进行学习的办法，通过在图中的节点和边上制订聚合的策略，GNN可能学习到图构造数据中节点以及边外在法则和更加深层次的语义特色。图神经网络不仅成为学术界钻研热点，而且曾经在工业界广泛应用落地。特地在搜寻、举荐、地图等畛域，采纳大规模分布式图引擎对异构图构造进行建模，曾经成为技术倒退的新趋势。

目前，分布式图学习框架通常在CPU集群上部署分布式图服务以及参数服务器，来反对大规模图构造的存储以及特色的更新。然而，基于CPU算力的图学习框架在建设老本、训练速度、稳定性以及简单算法反对等方面都存在有余。

因而，百度飞桨推出了可能同时反对简单图学习算法+超大图+超大离散模型的GPU大规模图学习训练框架PGLBox。该框架联合了百度挪动生态模型团队在大规模业务技术的深耕，凝聚飞桨图学习PGL丰盛的算法能力与利用教训，并依靠飞桨深度学习平台通用的训练框架能力与灵便组网能力，不仅继承了飞桨后期开源的Graph4Rec[1]超大规模、灵便易用和适用性广的长处[2]，更是在训练性能、图算法能力反对方面取得了显著晋升。

01 超高性能的GPU分布式图学习训练框架

随着图数据规模的一直增大，基于CPU分布式的解决方案须要大量的跨机器通信，导致训练速度慢且稳定性差。为了解决这个问题，PGLBox将图存储、游走、采样、训练全流程GPU化，并实现流水线架构，极致晋升异构硬件效率，大幅晋升了图学习算法的训练速度。同时，针对NVLink拓扑、网卡拓扑非全互联问题，实现智能化直达通信，进一步晋升训练能力。相比基于MPI CPU分布式的传统计划，训练速度晋升27倍。PGLBox实现了多级存储体系，对图、节点属性和图模型进行差异化存储，即图构造全显存、节点属性二级存储和图模型三级存储，将图规模晋升了一个数量级。为了均衡磁盘、内存、显存之间的占用，PGLBox实现了平衡训练，对Pass大小平滑解决，削峰填谷，升高峰值显存，使得在单机状况下，可反对的图规模失去大幅晋升。

02 全面降级预置的图示意学习算法

图节点的属性是多种多样的，能够是文本、图像，也能够是用户画像、地理位置等，如何更好地建模节点特色是图示意学习的一个重要挑战。随着预训练模型席卷NLP、CV等畛域，预训练Transformer是节点属性建模不可或缺的一部分。而简单构造的Transformer等预训练模型的引入所减少的大量计算量，是以往CPU分布式图示意学习框架不可承受的。

得益于PGLBox同时兼备GPU的运算能力和大规模图的反对，让咱们可能同时实现大规模预训练模型+大规模图构造信息+大规模离散特色的端对端对立建模。在大规模图数据，通过三级存储加载之后，咱们能够通过加载不同的大规模预训练模型（例如ERNIE语言大模型、ERNIE-ViL跨模态大模型等）来建模更丰盛的节点信息。对于大规模离散特色如用户ID、商品ID等，咱们能够同时利用到PGLBox提供的GPU参数服务器能力来建模。最初通过图信息汇聚的Graph Transformer图神经网络模块实现信息聚合，失去图的最终示意，并配合上游工作实现跨模态异构图端对端优化。

基于PGLBox的GNN技术取得了NeurIPS 2022大规模GNN挑战赛冠军[3]，同时入选了百度Create2022十大黑科技，并在WAVE SUMMIT+2022上作为飞桨2.4版本最重要的框架新个性之一公布。凭借其超高性能、超大规模、超强图学习算法、灵便易用等个性，PGLBox在百度内大量业务场景实现广泛应用并获得显著业务收益，如百度举荐零碎、百度APP、百度搜寻、百度网盘、小度平台等。

在哪里能够找到咱们～

看到这里置信大家曾经急不可待想要开箱试用了吧！PGLBox已全面开源，欢送大家试用或转发举荐，具体代码库链接请戳下方链接或者点击浏览原文！

⭐️欢送STAR珍藏⭐️

https://github.com/PaddlePadd…

更多交换欢送通过邮件pglbox@baidu.com与咱们分割，感激反对！

参考文献

[1]https://arxiv.org/abs/2112.01035
[2]举荐成果不如意，不如试试飞桨图学习
[3]https://ogb.stanford.edu/neur…

关于前端:推荐场景太大太复杂搞不动快来试试-PGLBox

01 超高性能的GPU分布式图学习训练框架

02 全面降级预置的图示意学习算法

在哪里能够找到咱们～

参考文献

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于前端:推荐场景太大太复杂搞不动快来试试-PGLBox

01 超高性能的GPU分布式图学习训练框架

02 全面降级预置的图示意学习算法

在哪里能够找到咱们～

参考文献

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复