乐趣区

关于监控工具:Openfalcon-aggregator表达式解析计算过程及其优化

以上面两个聚合规定为例,详解 aggregator 表达式的解析和计算过程,并提出能够优化的中央。

# 计算 cpu.used.percent 的平均值
分子:$(cpu.used.percent)
分母:$#

# 计算 cpu.idle + cpu.busy 为 100 的机器个数
分子:($(cpu.idle) + $(cpu.busy)) > 90
分母:1

1. 解析

numberatorStr 和 denominatorStr 别离是分子和分母的表达式字符串;

表达式中带 $(的是须要计算的:

// $(cpu.used.percent): true
// $#: false
// ($(cpu.idle) + $(cpu.busy)) > 90: true
// 1: false
needComputeNumerator := needCompute(numeratorStr)
needComputeDenominator := needCompute(denominatorStr)

func needCompute(val string) bool {return strings.Contains(val, "$(")
}

如果不须要计算,返回的 numeratorOperands/numeratorOperators/numeratorComputeMode 都为空;

// $(cpu.used.percent) 返回 [cpu.used.percent] [] ""// ($(cpu.idle) + $(cpu.busy)) > 90 返回 [cpu.idle cpu.busy] []">90"
numeratorOperands, numeratorOperators, numeratorComputeMode := parse(numeratorStr, needComputeNumerator)
denominatorOperands, denominatorOperators, denominatorComputeMode := parse(denominatorStr, needComputeDenominator)    

func parse(expression string, needCompute bool) (operands []string, operators []string, computeMode string) {
    if !needCompute {return}
    splitCounter, _ := regexp.Compile(`[\$\(\)]+`)
    items := splitCounter.Split(expression, -1)
    count := len(items)
    for i, val := range items[1 : count-1] {
        if i%2 == 0 {operands = append(operands, val)
        } else {operators = append(operators, val)
        }
    }
    computeMode = items[count-1]
    return
}    

2. 计算

先查问聚合组下的 hosts 列表,再查 host 列表的最新指标值,保留到 map,以供聚合时应用:

hostnames, err := sdk.HostnamesByID(item.GroupId)
//numeratorOperands 和 denominatorOperands 保留了表达式蕴含的指标名称
valueMap, err := queryCounterLast(numeratorOperands, denominatorOperands, hostnames, now-int64(item.Step*2), now)

聚合过程的代码,对 hosts 进行遍历,最终失去 numberator,denominator,validaCount:

for _, hostname := range hostnames {
    if needComputeNumerator {numeratorVal, err = compute(numeratorOperands, numeratorOperators, numeratorComputeMode, hostname, valueMap)
    }
    if needComputeDenominator {denominatorVal, err = compute(denominatorOperands, denominatorOperators, denominatorComputeMode, hostname, valueMap)
    }
    numerator += numeratorVal
    denominator += denominatorVal
    validCount += 1
}

if !needComputeNumerator {
    if numeratorStr == "$#" {numerator = float64(validCount)
    } else {numerator, err = strconv.ParseFloat(numeratorStr, 64)
    }
}
if !needComputeDenominator {
    if denominatorStr == "$#" {denominator = float64(validCount)
    } else {denominator, err = strconv.ParseFloat(denominatorStr, 64)
    }
}

第一个表达式的聚合过程:

  • 分子:$(cpu.used.percent) 须要计算,它查问每个 host 的 cpu.used.percent 的值,而后累加到 numberator 中;
  • 分母:$# 不须要计算,它累加 host 的个数,保留在 denominator 中;
  • 故分子 / 分母 = 所有 host 的 cpu.used.percent 的平均值

第二个表达式的聚合过程:

  • 分子:($(cpu.idle) + $(cpu.busy)) > 90,它计算每个 host 的 cpu.idle + cpu.busy > 90 是否成立,若成立则为 1,否则为 0,而后累加到 numberator 中;
  • 分母:1 不要计算,denominator=1;
  • 故分子 / 分母 = 所有 host 中满足 cpu.idle+cpu.busy > 90 的个数;

compute() 的过程,以最简单的 ($(cpu.idle) + $(cpu.busy)) > 90 为例:

  • operands: 操作数有两个 cpu.idle 和 cpu.busy;
  • opearots:操作符有 1 个 +;
  • computeMode=”>90″: 布尔判断;
func compute(operands []string, operators []string, computeMode string, hostname string, valMap map[string]float64) (val float64, err error) {
    ....
    vals := queryOperands(operands, hostname, valMap)
    if len(vals) != count {return val, errors.New("value invalid")
    }
    sum := vals[0]
    // 操作符仅反对 + 和 -
    for i, v := range vals[1:] {if operators[i] == "+" {sum += v} else {sum -= v}
    }
    // 存在布尔判断,判断胜利,val=1
    if computeMode != "" {if compareSum(sum, computeMode) {val = 1}
    } else {val = sum}
    return val, nil
}

布尔的比拟操作也很简略,sum= 累加的值,computeMode=”>90″,字符串解析失去比拟符:

func compareSum(sum float64, computeMode string) bool {regMatch, _ := regexp.Compile(`([><=]+)([\d\.]+)`)
    match := regMatch.FindStringSubmatch(computeMode)

    mode := match[1]
    val, _ := strconv.ParseFloat(match[2], 64)

    switch {
    case mode == ">" && sum > val:
    case mode == "<" && sum < val:
    case mode == "=" && sum == val:
    case mode == ">=" && sum >= val:
    case mode == "<=" && sum <= val:
    default:
        return false
    }
    return true
}

3. 优化

上述的表达式解析和计算,是依照固定的格局解析字符串实现的,比方正则解析 >90,先失去 > 操作符,再失去 90 操作数。

在具体实现时,能够采纳表达式引擎来优化,比方 github.com/antonmedv/expr,这样就不用关注表达式的语法解析,能够将注意力集中于业务流程;毛病是因为应用通用的表达式引擎,执行速度可能没有本人解析快。

应用表达式引擎的 demo:github.com/antonmedv/expr

env := map[string]interface{}{
        "cpuIdle": 30,
        "cpuBusy": 40,
    }
code := `(cpuIdle + cpuBusy) > 50`
program, err := expr.Compile(code, expr.Env(env))
output, err := expr.Run(program, env)
退出移动版