共计 503 个字符,预计需要花费 2 分钟才能阅读完成。
介绍
近程 DeathWatch 应用心跳音讯和故障检测器来检测网络故障和 JVM 解体。
Hayashibara 等人施行的“Phi 应计故障检测器”解释了心跳达到工夫。
故障检测器心跳
心跳默认状况下每秒发送一次,这是可配置的。它们在申请 / 回复握手中执行,并且回复输出到故障检测器。
故障的可疑水平由称为 phi 的值示意。phi 故障检测器的根本思维是在能够动静调整以反映以后网络情况的标度上表白 phi 的值。
phi 的值计算如下:
phi = -log10(1-F(timeSinceLastHeartbeat))
其中 F 是正态分布的累积散布函数,具备依据历史心跳达到间隔时间估算的平均值和标准偏差。
应计的故障检测器使监督和解释拆散。这使得它们实用于更宽泛的场景,并且更适宜构建通用的故障检测服务。其思维是保留从其余节点接管到的心跳计算出的故障统计数据的历史记录,并试图通过思考多个因素以及它们随工夫的累积如何进行有依据的猜想,以便提出更好的倡议。猜想特定节点是否处于运行状态。不仅要答复“节点是否断开?”问题,还要答复“是”或“否”。它返回一个 phi 值,示意节点产生故障的可能性。
下图阐明了自上一个心跳以来 phi 如何随着工夫减少而减少。
正文完