一 概述
可用性是零碎运行品质的重要指标.
随着数字化和智能化的过程, 零碎的可用性愈发重要。例如,制造业流水线须要高可用性的 MES 零碎来保障流水线的失常运行。
本文为 高可用 相干的技术文档, 从以下几个方面对 高可用 在制造业的利用和施行进行详细描述。
1.1 可用性 (Availability) 定义
GB/T3187-97 对可用性的定义:
在要求的内部资源失去保障的前提下,产品在规定的条件下和规定的时刻或工夫区间内处于可执行规定性能状态的能力。它是产品可靠性、维修性和培修保障性的综合反映。
可用性计算公式:
Availability = MTBF / (MTBF + MTTR)
对于 Availability 这个计算公式, 通常大家习惯用 N 个 9 来表征零碎可用性,如 99.9%(3-nines availability),99.999%(5-nines availability)。
一句话概括:
- 可用性 ─ 每次拜访都能收到非错响应
宕机工夫(DownTime):
定义: 机器呈现故障的停机工夫。这里之所以会提 Downtime,是因为应用每年的宕机工夫来掂量零碎可用性,更合乎直觉,更容易了解.
可用性 (Availability) 和宕机工夫 (Downtime) 的对应关系:
可用性 | 宕机工夫 |
---|---|
90% | 36.5 天 / 年 |
99% | 3.65 天 / 年 |
99.9% | 8.76 小时 / 年 |
99.99% | 52 分钟 / 年 |
99.999% | 5 分钟 / 年 |
99.9999% | 31 秒 / 年 |
1.2 高可用 (High Availablility) 定义
高可用性定义:
高可用性 (HA) 是零碎的一个个性,它的指标是确保一个约定的运行性能程度 (通常是失常运行工夫) 高于失常工夫。
如果用户不能拜访零碎,从用户的角度来看,零碎是不可用的。通常,停机工夫指的是零碎不可用的工夫。
1.3 高可用性实现形式
有两种反对高可用性的模式: 故障转移(fail-over)和冗余(redundant)。在通常的高可用计划中, 这 2 种是联合起来应用.
故障转移:
定义:
在计算和网络等相干技术中,故障转移是指在先前流动的应用程序、服务器、零碎、硬件组件或网络产生故障或异样终止时,切换到冗余或备用计算机服务器、零碎、硬件组件或网络。
故障转移又具备多种实现形式, 其中罕用的一种为:
主用到备用切换(Active-passive)
对于主用到备用的故障切换流程是,主用服务器发送周期信号给待机中的备用服务器。如果周期信号中断,备用服务器切换成工作服务器的 IP 地址并复原服务。
宕机工夫取决于备用服务器处于「热」待机状态还是须要从「冷」待机状态进行启动。只有主用服务器解决流量。
主用到备用的故障切换也被称为主从切换。
知识点:
Web 服务器高可用计划中, NGINX 的高可用计划 – NGINX + Keepalived 高可用 就是典型的主从切换.
且备用 NGINX 服务器出于「热」待机状态.
1.4 指标
本文的指标是:
为 制造业 的零碎高可用计划规范提供实用参考. 以满足其:
- 对已有的零碎进行 高可用 革新;
- 对新零碎进行 高可用 架构要求;
二 适用范围及要求
2.1 适用范围
- 对可用性指标有强制要求的零碎;
- 重要零碎(如: MES 零碎);
- 技术架构合乎下文技术计划形容的零碎;
参考文件
参考文件 |
---|
Availability – Wikipedia |
High Availability – Wikipedia |
system-design-primer – GitHub |
三人行, 必有我师; 常识共享, 天下为公. 本文由东风微鸣技术博客 EWhisper.cn 编写.