共计 2034 个字符,预计需要花费 6 分钟才能阅读完成。
故障切换
如果主节点产生故障, 日志同步将进行。此时必须激活备用主节点。激活备用主节点后, Oushu Database 将重建最初一胜利提交的事务时的状态。
手动激活备用主节点
- 确保已为系统配置了备用主节点。
- 请登录到 Oushu Database 备用主节点并激活:
oushu_master$ hawq activate standby
激活备用主节点后, 它将成为 Oushu Database 群集的沉闷的主节点。
- (可选)配置新的备用主节点。无关阐明, 请参阅「向现有群集增加备用主节点」- http://www.oushu.com/docs/ch/…。
- 通过在主节点上执行以下命令来查看 Oushu Database 群集的状态:
oushu_master$ hawq state
新激活的主节点的状态应为 active。如果配置了新的备用主节点, 则备用主节点状态为 passive。当未配置备用主节点时, 该命令将显示 -No entries found, 批示没有配置主节点。
- 查问该 gp_segment_configuration 表来验证 segment 节点是否已将本人注册到新的 master 节点:
oushu_master$ psql dbname -c ‘SELECT * FROM gp_segment_configuration;’ - 最初, 通过查问 gp_master_mirroring 视图来查看新增加的备用主节点的状态。无关阐明, 请参阅「查看备用主节点的状态」- http://www.oushu.com/docs/ch/…。
主动激活备用主节点
最新的 Oushu Database 反对备用主节点的主动激活,您能够按如下步骤关上此性能。 - 确保已为系统配置了备用主节点。
- 您能够在启动集群前,在配置文件 hawq-site.xml 中增加如下属性并同步到各节点,也能够在启动集群后再批改 GUC 值。(情谊提醒:对于首次应用 Oushu Database 的用户,倡议先跳过此步骤,防止因某些操作不慎导致 master 启动失败,引发主节点切换,给后续操作带来麻烦。)
<property><name>enable_master_auto_ha</name><value>on</value></property><property><name>ha_zookeeper_quorum</name><value>ZKHOST1:2181,ZKHOST2:2181,ZKHOST3:2181</value></property>
enable_master_auto_ha
off
是否容许主动切换
ha_zookeeper_quorum
localhost:2181
集群中 zookeeper 服务所在的地位
强烈建议您将 zookeeper 集群所有服务端的地址增加到 ha_zookeeper_quorum 中,请参见「装置 HDFS」- http://www.oushu.com/docs/ch/… 时在 core-site.xml 中对 ha.zookeeper.quorum 的设置,而非应用默认值。这是为了保障 Oushu Database 主节点与备用主节点应用雷同的 zookeeper 服务,以防止本地 zookeeper 服务无奈应用而导致 Oushu Database 无奈主动切换或者产生谬误切换。
(注:如果第一个属性值为 on,则要求用户手动将第二个属性值增加到 hawq-site.xml,以确保 zookeeper 服务被能失常拜访,否则 Oushu Database 将不会启动。)
- 启动运行 Oushu Database 后,您能够间接查问上述属性值是否设置正确:
oushu_master$ hawq config -s enable_master_auto_ha
GUC : enable_master_auto_ha
Value : on
oushu_master$ hawq config -s ha_zookeeper_quorum
GUC : ha_zookeeper_quorum
Value : x.x.x.x:2181,y.y.y.y:2181,z.z.z.z:2181 - 如果运行时的集群的上述属性值没有设置失当(针对跳过第 2 步的用户),您能够在主节点上手动批改,并重启集群:
oushu_master$ hawq config -c enable_master_auto_ha -v on
oushu_master$ hawq config -c ha_zookeeper_quorum -v x.x.x.x:2181,y.y.y.y:2181,z.z.z.z:2181
oushu_master$ hawq restart cluster - 在 zookeeper 服务能失常拜访时(半数以上 zookeeper 节点存活),Oushu Database 的备用主节点能在主节点故障后 2~3 分钟内实现主动激活。(注:此时集群中不再有备用主节点,如需增加,后续步骤参见「向现有群集增加备用主节点」- http://www.oushu.com/docs/ch/…。)
正文完
发表至: oushuDB-HAWQ
2021-12-14