关于阿里云:MSE-诊断利器上线

4次阅读

共计 1832 个字符,预计需要花费 5 分钟才能阅读完成。

作者:子葵

背景

在日常开发和生产环境中,可能会遇到因为网络或者其余因素导致客户端连贯 MSE 集群出现异常,此时须要排查集群以及客户端状态,通常须要通过文档查问对应的异样解释来定位问题,排查问题的链路比拟长,比拟耗时。因而 MSE 提供了一键诊断工具,发现 client -> server 链路上的问题并提供倡议,使得问题排查更加快捷。

轻松上手

在日常应用中可能会遇到 MSE 实例端口不通,客户端呈现端口不可用的异样日志

此时咱们就能够通过 mseutil 疾速诊断网络问题。

  1. 通过文档下载对应平台的 mseutil 工具,工具是独立的二进制包可齐全独立运行。之后通过 mse 实例详情页面取得 MSE 实例的 serverAddr
  1. 通过以下命令进行疾速诊断:
mseutil {子产品名} inspect --serverAddr mse-xxxxx.aliyuncs.com

诊断分为根底网络诊断以及 API 诊断,网络诊断会测试客户端环境和 MSE 实例之间的网络连接是否可达,端口是否可拜访。API 诊断针对不同子产品的 API 进行测试,次要测试接口的可用性以及接口调用延时等信息。

mseutil zookeeper inspect --serverAddr mse-xxx-p.zk.mse.aliyuncs.com
mseutil nacos inspect --serverAddr mse-xxx-p.zk.mse.aliyuncs.com

此时咱们可知 DNS 解析失常,然而网络连接呈现问题,此时咱们依据文档中的谬误形容可排查到公网白名单未配置,此时只须要配置公网白名单即可。

如果一切正常会输入以下后果:

通过诊断后果咱们可知客户端环境到 MSE 实例之间的网络不通,之后可通过 MSE 对应文档排查具体起因,Nacos 诊断步骤和 ZooKeeper 统一。

MSE 实例操作

mseutil 提供对 MSE 实例的数据操作能力,兼容 zkCli,并且提供四字命令查问能力,具体应用可应用 -h 子命名查问应用办法,并且反对查问批改 Nacos 服务信息以及配置信息,使得线上环境排查问题更加便捷,mseutil 可齐全独立在 x86 以及 arm64 环境的 Windows,Linux,OSX 运行,防止繁琐的环境配置,上手即用。

反对四字命令查问 Server 状态并且兼容 zkCli

mseutil 反对 ZooKeeper 四字命令,例如可通过以下形式进行四字命令查问 Server 以后状态的摘要:

mseutil zookeeper 4lw --serverAddr mse-xxx.aliyuncs.com stat

mseutil 反对所有的 ZooKeeper 四字命令,可通过 mseuitl zookeeper 4lw -h 查看具体应用。

mseutil 兼容 zkCli,反对对 MSE ZooKeeper 中的数据进行查问和批改。

例如可通过以下命令快捷查问实例中对应 Path 的 Znode 数据:

mseutil zookeeper get --serverAddr=mse-xxxx.aliyuncs.com /zookeeper

相似的 mseutil 还反对(set,delete,ls,stat)等命令通过 mseutil zookeeper -h 获取更多帮忙。

反对对 Nacos 实例的服务信息查问和更新能力

mseutil 反对对 Naocs 一键诊断,反对查问根底的实例查问注册性能。一键诊断

mseutil nacos inspect --serverAddr ${实例连贯地址}

查问服务实例列表

mseutil nacos get instance -n ${namespaceId} -s ${serviceName} -g ${groupName}

注册对应服务的实例

mseutil nacos create instance <IP>:<PORT> -n ${namespaceId} -s ${serviceName} -g ${groupName} -c ${clusterName}

此外,诊断工具反对 Nacos 1.x 客户端协定和 Nacos 2.x 客户端协定,可通过参数切换:

mseutil nacos get instance -s ${serviceName} --v2

从而能够齐全笼罩客户端侧所有根本场景,缩小问题定位的老本。

将来布局

mseutil 将来还会反对更多的 MSE 子产品以及更细粒度的,更智能的诊断能力,包含客户端到 MSE 实例的网络报文剖析,客户端负载状态剖析,具体利用的资源占用程度以及 GC 剖析等能力,帮忙用户更便捷的排查在应用 MSE 产品过程中遇到的问题,晋升运维效率。

折扣流动

正文完
 0