关于开源:如何对-Databend-进行基准测试

Databend 的设计指标之一就是放弃最佳性能，为了更好观测和评估性能，社区不光提供一套简略的本地基准测试计划，还建设了可视化的继续基准测试。

hyperfine 是一种跨平台的命令行基准测试工具，反对预热和参数化基准测试。Databend 倡议应用 hyperfine 通过 ClickHouse / MySQL 客户端执行基准测试，本文将应用 MySQL 客户端来介绍它。

进行本地基准测试之前，必须实现以下几项筹备工作：

参照 Docs – Deploy Databend¹ 实现部署。
装置 MySQL 客户端。
依据 hyperfine – installation² 的提醒装置 hyperfine。

依据你的数据集特色和要害查问设计 SQL 语句，如果须要事后加载数据，请参考 Docs – Load Data ³。

为不便示范，这里选用 Continuous Benchmarking – Vectorized Execution Benchmarking⁴ 列出的 10 条语句，保留到 bench.sql 中。

SELECT avg(number) FROM numbers_mt(100000000000)
SELECT sum(number) FROM numbers_mt(100000000000)
SELECT min(number) FROM numbers_mt(100000000000)
SELECT max(number) FROM numbers_mt(100000000000)
SELECT count(number) FROM numbers_mt(100000000000)
SELECT sum(number+number+number) FROM numbers_mt(100000000000)
SELECT sum(number) / count(number) FROM numbers_mt(100000000000)
SELECT sum(number) / count(number), max(number), min(number) FROM numbers_mt(100000000000)
SELECT number FROM numbers_mt(10000000000) ORDER BY number DESC LIMIT 10
SELECT max(number), sum(number) FROM numbers_mt(1000000000) GROUP BY number % 3, number % 4, number % 5 LIMIT 10

上面给出一个 benchmark.sh 范本，能够简化整个基准测试流程：

#!/bin/bash

WARMUP=3
RUN=10

export script="hyperfine -w $WARMUP -r $RUN"

script=""
function run() {
        port=$1
        sql=$2
        result=$3
        script="hyperfine -w $WARMUP -r $RUN"
        while read SQL; do
                n="-n"$SQL" "
                s="echo"$SQL"| mysql -h127.0.0.1 -P$port -uroot -s"
                script="$script'$n''$s'"
        done <<< $(cat $sql)

        script="$script  --export-markdown $result"
        echo $script | bash -x
}


run "$1" "$2" "$3"

在这个脚本中：

应用 -w/–warmup & WARMUP 在理论基准测试之前运行 3 次程序执行来预热。
应用 -r/–runs & RUN 要求执行 10 次基准测试。
容许指定 Databend MySQL 兼容服务的端口。
容许指定输出的 SQL 文件，以及输入时的 Markdown 文件。

在应用前须要先运行 chmod a+x ./benchmark.sh 赋予其可执行权限。用法如下所示：

./benchmark.sh <port> <sql> <result>

执行基准测试并获取后果：

在这个例子中，MySQL 兼容服务的端口是 3307，基准测试用到的 SQL 文件为 bench.sql , 预期的输入在 databend-hyperfine.md。

./benchmark.sh 3307 bench.sql databend-hyperfine.md

当然，你能够依据本人的配置和须要进行调整。

留神：上面的示例是在 AMD Ryzen 9 5900HS & 16GB RAM 配置下运行产生，仅供参考。

终端中的输入如下所示：

Benchmark 1:  "SELECT avg(number) FROM numbers_mt(100000000000)"
  Time (mean ± σ):      3.486 s ±  0.016 s    [User: 0.003 s, System: 0.002 s]
  Range (min … max):    3.459 s …  3.506 s    10 runs

最终的后果会保留在 databend-hyperfine.md 中，如下所示。

Databend 的继续基准测试由 GitHub Action + Vercel + DatabendCloud 强力驱动，在 datafuselabs/databend-perf ⁵ 这个 repo 中开源了源代码和 Workflow。

我的项目布局:

.
├── .github/workflows    # 继续集成工作流
├── benchmarks           # YAML 格局的 SQL Query 测试套件
├── collector            # 分类寄存性能数据
├── front                # 可视化前端
├── reload               # YAML 格局的 Data Load 测试套件
└── script               # 数据预处理脚本

Workflow:

继续基准测试工作流定时打算执行，Perf Workflow 会在每天 00:25 UTC（北京工夫 08:25）执行，Reload Workflow 会在每周五 08:25 UTC（北京工夫 16:25）执行。

通过 GitHub API 获取以后日期和最新版本的 TAG。
利用 perf-tool 和 DatabendCloud 进行交互，运行测试。
长久化性能数据到 databend-perf 这一 repo 中。
执行脚本解决数据，使之生成前端须要的格局。
构建前端，实现可视化。

databend-perf 中的测试套件分为 Query Benchmark 和 Load Benchmark 两类，前者放在 benchmarks 目录下，后者放在 reload 目录下。测试用 YAML 格局定义：

metadata:
  table: numbers

statements:
  - name: Q1
    query: "SELECT avg(number) FROM numbers_mt(10000000000);"

metadata 中的 table 字段是必须的，且调配给每类 benchmark 的值都惟一。statements 则只须要指定 name 和 query。

向量化执行基准测试：

定义在 benchmarks/numbers.yaml，一组数值计算 SQL，利用 Databend 的 numbers 表函数提供百亿级别的数据量。残缺语句也能够在 Continuous Benchmarking – Vectorized Execution Benchmarking⁶ 查看。

Ontime 常见剖析场景基准测试：

定义在 benchmarks/ontime.yaml，一组常见的空中交通剖析 SQL，基于美国交通部公开的 OnTime 数据集，共计 202,687,654 条记录。以后此基准测试不蕴含 JOIN 语句，Q5、Q6、Q7 均采纳优化后的模式。残缺语句也能够在 Continuous Benchmarking – Ontime Benchmarking ⁷ 查看。

Ontime 数据集载入基准测试：

定义在 reload/ontime.yaml，同样基于美国交通部公开的 OnTime 数据集，通过 s3 进行 COPY INTO。

要害语句：

COPY INTO ontime FROM 's3://<bucket>/m_ontime/' 
credentials=(aws_key_id='AWS_KEY_ID' aws_secret_key='AWS_SECRET_KEY') 
pattern ='.*[.]csv' file_format=(type='CSV' field_delimiter='\t' record_delimiter='\n' skip_header=1);

下面 SQL 语句中的 m_ontime/ 目录即为数据集：由原来 60.8 GB 数据全副合并后，再拆分成 100 个大小相近的文件。

基准测试失去的数据是 Json 格局的，会分类寄存到 collector 这个目录下。metadata 局部是蕴含表、版本、机器规格的信息；schema 局部则是对每条语句执行状况的统计，包含中位数、平均数等。示例：

{
    "metadata":{
        "table":"numbers",
        "tag":"v0.7.92-nightly",
        "size":"Large"
    },
    "schema":[
        {
            "name":"Q1",
            "sql":"SELECT avg(number) FROM numbers_mt(10000000000);",
            "min":0.305,
            "max":0.388,
            "median":0.354,
            "std_dev":0.02701407040784487,
            "read_row":10000000000,
            "read_byte":80000000000,
            "time":[
                0.315,
                0.326,
                ...
            ],
            "error":[ ],
            "mean":0.34774024905853534
        },
        ...
    ]
}

经由 stript/transform.go 解决，为每个查问的对应图表聚合数据，次要强调最大、最小、均值、中位数四个指标。

示例：

{
    "title":"Q1",
    "sql":"SELECT avg(number) FROM numbers_mt(10000000000);",
    "lines":[
        {
            "name":"min",
            "data":[
                3.084,
                3.097,
                3.043,
                ...
            ],
        ...
        }
    ],
    "version":[
        "v0.7.0-nightly",
        "v0.7.1-nightly",
        "v0.7.2-nightly",
        ...
    ],
    "legend":[
        "min",
        ...
    ], 
    "xAxis":[
        "2022-03-28",
        "2022-03-29",
        "2022-03-30",
        ...
    ],
}

目前可视化计划采纳 React + Echarts 实现，每个图表都对应下面解决失去的一个 Json 文件。在增加新的基准测试后，无需批改前端即可展示新的图表。

Graphs：

以折线图的模式展现性能变动，并反对通过拖动图表下方的选择器调整展现的工夫区间。
横轴为日期，纵轴为执行用时，鼠标悬浮到上方即可查看当次执行的信息。

Compare：

反对任选两天比照执行用时的变动，以百分比模式展现。

Status：

关注以后最新性能测试后果中各指标的状况，以柱型图展现。
横轴为不同类型，纵轴为执行用时。

目前 https://perf.databend.rs 为 Databend 提供了根本的继续性能监控计划，但依然须要关注以下几个方向的内容：

选取更有代表性的指标：执行次数较少（只有 10 次），可供选择的指标可能不够具备代表性。例如：将次数进步到 100 次以获取 P90 来代替以后应用的中位数可能是比拟适合的。
减少性能测试场景的笼罩：后续能够持续新增对其余数据集和场景的性能测试，比方 ssb、hits。
丰盛性能监控的方向：监控 IO 和网络性能体现，对局部重点查问提供额定的性能评估，比方解析 Json 的性能体现。

Databend 是一款开源、弹性、低成本，基于对象存储也能够做实时剖析的旧式数仓。期待您的关注，一起摸索云原生数仓解决方案，打造新一代开源 Data Cloud。

Databend 文档：https://databend.rs/
Twitter：https://twitter.com/Datafuse_…
Slack：https://datafusecloud.slack.com/
Wechat：Databend
GitHub：https://github.com/datafusela…

文章首发于公众号：Databned

https://databend.rs/doc/deploy ↩
https://github.com/sharkdp/hy… ↩
https://databend.rs/doc/load-… ↩
https://databend.rs/doc/contr… ↩
https://github.com/datafusela… ↩
https://databend.rs/doc/contr… ↩
https://databend.rs/doc/contr… ↩

关于开源:如何对-Databend-进行基准测试

本地基准测试

后期筹备：

设计基准测试套件：

应用 bash 脚本简化流程：

继续基准测试

根本介绍

测试套件：

数据处理：

可视化：

后续优化

对于 Databend