2023年2月,openGemini正式申请加入openEuler DB SIG,现已实现对openEuler的各项兼容性测试,并打算退出openEuler 23.03版本。openGemini可在物联网、嵌入式、边缘计算、运维监控(AIOps)等畛域与openEuler社区开展单干,充沛利用自身技术竞争劣势,加强openEuler社区的影响力和竞争力的同时,一直开掘新的时机和技术创新点,进一步晋升openGemini的技术实力和社区品牌知名度。
我的项目地址
https://github.com/openGemini
https://gitee.com/src-openeuler/openGemini
我的项目官网
http://opengemini.org
openGemini简介
openGemini是由华为云数据库翻新实验室自行设计、研发并面向寰球开源的一款云原生分布式时序数据库。次要面向物联网和运维监控等场景,提供海量时序数据库解决和剖析的开源解决方案,以进一步升高企业经营和运维老本,晋升产品质量和生产效率。
openGemini倒退历程
如图所示,openGemini经验了最后由InfluxDB革新的技术摸索,到云服务商用、自研内核加强和开源等多个阶段的倒退,禁受住了华为云内外部100余家用户不同业务场景的打磨和测验,现已凋谢全副外围源码,全面拥抱开源,打造共享、共治、共建的开发社区,构建寰球技术生态和影响力。
openGemini的架构
openGemini采纳MPP大规模并行处理分层架构,由ts-sql、ts-store、ts-meta组成。
- ts-sql:对立解决客户端申请
数据依照工夫线一致性Hash形式打散存储在不同的ts-store中,在查问语句执行期间,从ts-store获取数据并汇总,并返回客户端
- ts-meta:对立元数据管理
数据库集群元数据和数据库元数据管理,如节点信息、数据保留工夫、数据分区信息、表信息等
- ts-store:对立数据管理
将原始数据按时序优化的数据格式进行对立组织和存储,查问时,按指定工夫范畴和工夫线ID查问数据,并依据过滤条件,返回指标数据
openGemini的外围竞争力
openGemini开源后继续版本迭代,现已公布v1.0.0版本,在高性能、高平安、企业级个性、可扩展性、性能、利用开发等六个方面已全面具备生产环境可应用的残缺能力。
● 高性能
openGemini针对物联网、运维监控等畛域海量数据管理和剖析诉求,对计算引擎和存储引擎做了大量的优化设计,获得了显著成果。
- 反对亿级指标治理
- 每秒千万级指标数据并发写入
- 查问万级指标数据毫秒级响应
在30万指标,259亿条指标测试数据的场景下,采纳TSBS(https://github.com/timescale/tsbs)性能测试工具,相比开源的单机版InfluxDB v1.7,openGemini单机版写入性能晋升5倍,简略查问晋升2-5倍,简单查问响应工夫缩短60倍以上。
● 高平安
openGemini反对数据传输加密和用户明码鉴权,反对用户弱明码校验和审计日志。此外,openGemini集群的各组件之间通信可配置HTTPS双向认证(Mutual TLS),确保每一个链接都是可信的。
● 企业级个性
openGemini具备丰盛的企业级个性,局部要害个性如下:
l 高效数据压缩
采纳列式数据存储,不同数据类型对应不同的数据压缩算法,可反对PB级指标数据的长期数据存储。存储老本是传统关系型数据库 1/20,是NoSQL的 1/10
l 反对数据保留策略
数据过期后主动删除
l 反对写前日志(WAL)
设施掉电后,缓存数据不失落
l 流计算
当数据量较大时,传统降采样工作形式对磁盘I/O耗费过大,I/O放大也很重大。可通过流式计算,写入数据的同时实现数据降采样,该办法具备高性能、网络开销小的长处
l 数据分级存储
联合时序数据特点,数据按热、温、冷多级存储,进一步晋升查问性能
l 内核运行状态可观测
提供了开源监控工具ts-monitor,可采集260余种内核和服务器要害监控指标,更好的察看零碎的运行状况,疾速排查、定位和解决问题
l 多级降采样
可针对不同工夫范畴的历史数据进行不同形式的降采样,保留历史数据的特色,原地删除其余历史数据,节约存储空间50%,计算资源节约90%
l 向量化
充分利用架构的并行处理劣势,每次迭代批量返回数据,大数据量下查问性能更好
l 异样检测和预测
内置基于AI的时序异样检测和预测剖析框架,具备流批一体、重大水平分级等多项能力,反对每秒万级实时指标数据并发检测,内含13种异样检测器,可笼罩常见的离群点、数值变动、阈值、持续上升降落等常见时序异样场景
● 可扩展性
openGemini集群由ts-sql、ts-store、ts-meta组成,反对繁多组件独立横向扩大,可反对100+节点的集群规模。
● 性能
openGemini提供丰盛的聚合算子(如COUNT、SUM、MAX等)、统计分析算子(如PERCENTILE分位数、DIFFERENCE等)、算术剖析算子(如ABS、LN等)、Full Join、近似统计算子以及字符串算子(如SUBSTR、STR等)共60+个。此外,还反对秒、毫秒、纳秒等多种工夫精度以及TAG(分组查问)和嵌套查问。
● 利用开发(技术生态)
如图所示,在时序大数据处理方面,openGemini已初步实现对数据接入、数据存储、数据可视化、数据分析、数据迁徙等各环节要害能力构建和技术生态对接。
在云原生方面,openGemini已反对K8s、KubeEdge容器化部署,正在踊跃和KubeEdge社区进行联结翻新。
在底层操作系统方面,openGemini反对支流的Linux零碎和x86、arm64等架构。
在利用开发方面,反对C/C++、Java、JavaScript、Ruby、GO、Python、PHP等支流的开发语言。
总结
openGemini具备卓越的读写性能和高效的数据分析能力,反对单机和集群,部署形式多样,可边缘、可云、可物理机部署,反对支流开发语言,二进制运行,无第三方组件依赖,带有260+项零碎运行指标监控,运维简略。
独木难成林,百川聚江海。openGemini与openEuler独特携手,单方将在IoT、AIOps、嵌入式、边缘计算等畛域深入技术解决方案集成,发展线上开源合作和线下社区互动等方面单干,致力为寰球开发者提供一流的行业解决方案。
如果您对openGemini感兴趣,欢送分割咱们
https://opengemini.org/contact-us