关于开源:Apache-HugeGraph100-版本正式发布

37次阅读

共计 2214 个字符,预计需要花费 6 分钟才能阅读完成。

摘要:百度平安助力国产数据库走向国内,与用户开发者共成长

日前,Apache HugeGraph (incubating) 第一个 Apache Release 版本 1.0.0 目前已正式公布,基于过来的一年工夫里社区的同学开发了许多实用的新性能,重构多个我的项目模块并对 ASF 标准进行了全方面的适配和革新,在基金会导师领导下解决了 ASF 开源我的项目合规性等问题后,此次新版本由 30+ 位 Contributors 奉献了超过 270 个 Pull Request,于 2023 年初开始进行首轮 Apache 孵化发版投票,最初通过两轮调整于 2023 年 3 月正式公布。

依据 DB-Engines 数据显示,自 2021 年初起开源数据库的寰球部署首次超过商业数据库,在于单纯依附个别技术或软件很难构建成熟、欠缺的产品,而依赖社区生态推动往往能打磨出杰出的数据库产品。并且开源数据库存在老本劣势、产品丰盛度、社区活跃性等方面的优越性,成为驱动数据库技术和市场改革的重要力量,也是构建国产自研数据库生态、减速技术迭代、让国产数据库走向国际化的重要途径,得以聚焦平安可控,通过构建数字技术创新体系和数字平安屏障,来为数字中国的倒退提供平安可控的底座,实现科技自立自强。

HugeGraph 是百度平安于 2017 年自主研发的国内首个开源图数据库,提供了一站式的千亿级大规模图数据的存储、在线查问、离线剖析能力,广泛应用于社交网络、广告举荐、网络安全、金融风控、智能机器人等场景。HugeGraph 于 2018 年开源,2022 年 1 月正式通过世界顶级开源组织 Apache 软件基金会的投票决定,以全票通过的优良体现正式成为寰球首个退出 Apache 孵化的图数据库我的项目,同年 5 月正式入驻 Apache 开启孵化,促使国产图数据库走向世界,在晋升图数据库产品开发效率、升高产业利用老本的同时,在人才、生态建设产生深远的影响,让更多开发者因而受害。Apache HugeGraph 在百度泛滥业务中施展了重要的作用,尤其是在反黑产、团伙发现等平安风控畛域效果显著,也成为泛滥百度合作伙伴的优质之选。截止发版时,HugeGraph 在 GitHub 上具备 2200+ Stars,我的项目总 Contributors 数量超过 80 名,社区版本下载量超过 2 万,并有超过 100 个社区用户、组织在应用,包含网商银行、网易游戏、360 平安、滴滴、科大讯飞、虎牙直播、CVTE、货拉拉等,并且以上公司也在与 HugeGraph 一道共建开源社区。

Apache HugeGraph 1.0.0 版本在性能和实用性、易用性上做了大量改良和修复,蕴含 25000+ 行 Pull Request 代码变更提交: 在零碎语言上,图数据库与图计算等组件均降级适配 Java 11,已笼罩所有子项目 , 并新增反对 Cypher 图查询语言,目前已同时反对 Gremlin 与 Cypher 两大支流图查询语言;在服务器上反对更多内置图算法,包含 16 个 OLAP 算法包含:LPA、Louvain、PageRank、Betweenness / Closeness / Eigencentrality Centrality、RingsDetect 等,2 个 OLTP 算法,包含:adamic-adar 和 resource-allocation; 在大规模并行图计算框架 (Computer) 上,反对海量图数据的 MPP 计算,尤其是扩散性 / 核心性等空间耗费大的算法,反对 K8s Standalone (单机) 模式,预留 Yarn 接口可实现间接对接;在大数据组件反对上,新增反对 Flink CDC 数据流式与同步导入、Spark 批量导入数据、反对 Bypass Server 模式,大幅提高了图数据库的在线 / 离线场景下的导入 / 导出 / 图迁徙性能和方便性; 并在易用性上, 提供一键 Server/Hubble 容器化 Docker 反对,重构整合图周边工具链为 HugeGraph Toolchain 等 120 多项细节版本更新。此外,在 2022 年 HugeGraph 相继实现了信创厂商飞腾、麒麟、海光等的兼容性认证,并入选了年度“科创中国”十大开源翻新我的项目榜单。

HugeGraph 不仅是国内第一个开源的图数据库产品,也是惟一捐献给 ASF 的图零碎。它实现了 Apache TinkerPop3 框架兼容 Gremlin + Cypher 查询语言,具备欠缺的工具链组件,助力用户轻松构建基于图数据库之上的利用和产品。HugeGraph 反对百亿以上的顶点和边疾速导入,并提供毫秒级的关联关系查问能力(OLTP),还可与 Hadoop、Spark 等大数据平台集成以进行数据集成,提供自研的图计算零碎,造成整合的一站式图服务。图数据库可能撑持新型利用场景的关联剖析业务,依据 Gartner 预测,到 2025 年图技术将利用于 80% 的数据和剖析翻新,而图技术是图数据库的核心技术。

百度不仅参加开源生态,也秉承开源凋谢姿势踊跃建设开源生态,奉献了大量的开源我的项目,如中国首个自主研发开源凋谢的产业级深度学习平台飞桨、主动驾驶平台 Apollo、可视化渲染库 Apache ECharts、数据仓库 Apache Doris 等。一方面是因为百度的技术基因,另一方面也是表白一种凋谢的态度。百度深深了解在技术畛域一枝独秀不是春,只有拥抱开源,很多技术和产品能力减速倒退、拓宽边界,实现与宽广用户及开发者独特成长,打造凋敝的开源生态。

正文完
 0