ClickHouse 是 Yandex 开发的用于联机剖析 (OLAP) 的 DBMS。2016 年依据 Apache 2.0 许可证开源。性能上反对 DDL、DML、数据备份复原、权限管制、分布式治理等齐备的 DBMS 性能,SQL 根本与规范 SQL 兼容,反对丰盛的函数和数据类型,具备弱小的 MergeTree 表引擎,列式存储反对 LZ4 压缩,反对数据分片、数据分区、主键稠密索引、二级跳数索引,反对数据多正本、TTL 等,反对向量化执行、分布式多核并行计算、动静代码生成,性能卓越;实用于网络 /APP 流量剖析、用户行为记录剖析、商业智能(BI)、监控零碎等实时剖析场景。该引擎一经面世,便备受瞩目,其性能大幅超过了很多商业 MPP 计算框架,比方 Vertica、InfiniDB,相比同类竞品,ClickHouse 查问性能要快百倍以上,被称为最快的数据库。自 Hadoop 诞生以来,通过多年倒退,整个生态体系曾经十分成熟,但其最大短板还在于数据处理的时效性,ClickHouse 的诞生肯定意义上补救了这个短板。
目前 ClickHouse 在国内外社区非常炽热,少量厂家纷纷跟进并大规模投入使用,奉献大量胜利案例。ClickHouse 也在华为云外部多个产品中投入使用,如团体 IT 的自助剖析和行为剖析业务,电商平台等,集群总规模曾经达到数千节点(多套物理集群)。同时,华为云 FusionInsight MRS 提供 ClickHouse 实时 OLAP 服务,其基于开源版本进行了多个方面的性能优化和性能加强,次要如下:
ClickHouse 加强介绍
1. 可视化运维,蕴含装置、卸载、启停、配置、客户端、监控、告警、健康检查、日志等
2. 监控笼罩 CPU、内存、zookeeper、工作执行状况、数据库状态、数据正本等 70+ 项
3. 日志级别可视化配置动静失效、可视化下载、可视化检索、审计日志
3.1 日志级别可视化配置、实时动静失效:以后反对配置 5 种日志级别、日志文件大小、日志门路、批改后保留配置即时失效,无需重启服务
3.2 可视化日志下载:通过 FI manager 运维页面,能够抉择日志下载、并能够抉择下载的节点,以及下载的日志时间段,无需登录后盾下载日志。
3.3 华为减少审计日志:社区只有一个运行日志文件,华为减少审计日志,针对 DDL、平安、业务操作等内容记录审计。
3.4 反对日志在线检索:日志在线检索,能够抉择节点、关键词、工夫范畴、日志级别、过滤条件等
4. ClickHouse Balancer 路由拜访负载均衡器
5. 在线扩容 & 可视化数据迁徙,反对单表按节点、反对网络限速、反对进度查看、后果查看
6. 滚动降级 & 滚动重启
7. 平安加固、用户认证反对 kerberos、兼容社区形式
8. 可视化权限治理、无需后盾命令行操作、反对库表级别读写权限管制
9. 多集群治理,一个 Manager 管理系统反对治理多个 clickhouse 集群,最大反对 10000 节点治理
10. 客户端拜访,通道加密、kerberos 认证、兼容社区形式
10.1 命令行客户端 clickhouse-client
10.2 HTTP 客户端 Curl‘http://’
10.3 JDBC 业务利用
10.4 第三方 IDE/ 可视化界面 Tabix/HouseOps/LightHouse/Dbeaver/Grafana
11. 在原生的能力上、加强 remote 认证、Flink 对接、Loader 对接、Hetu 对接
11.1 反对可视化 FlinkSQL 实时数据写入 clickhouse
11.2 历史数据通过 loader 可视化界面定义工作,批量导入 clickhouse,数据源如 oracle、mysql、gaussdb、postgreSQL、HDFS
11.3 周边对接——对接 Grafana 和 DBeaver
12. 默认采纳两正本形式、主动生成集群分片拓扑、zk 防过载、阈值告警
13. 界面化慢 SQL 查问、慢 SQL 的阈值配置、慢 SQL 的杀停
本文由华为云公布