宜信开源UAVStack功能上新新增JVM监控分析工具

42次阅读

共计 2307 个字符,预计需要花费 6 分钟才能阅读完成。

摘要:UAVStack 推出的 JVM 监控分析工具提供基于页面的展现方式,以图形化的方式展示采集到的监控数据;同时提供 JVM 基本参数获取、内存 dump、线程分析、内存分配采样和热点方法分析等功能。

引言

作为 AllInOne 的智能化服务技术栈,UAVStack 提供了非常全面的监控数据采样功能,同时支持数据监控与预警。近期,我们整合了原有的数据采集展示功能,新增 JVM 分析功能,推出了更易用的 JVM 监控分析工具。

熟悉 JDK 的开发者都知道,JDK 本身提供了一套 JVM 分析工具,包括 jinfo、jmap、jstack 等。用户可以通过命令行轻松获取 JVM 内存堆栈信息、内存对象分配以及 JVM 启动基本参数信息。但这些工具需要在命令行环境中执行,且生产环境下则需要通过堡垒机转发。

开源社区一些不错的 JVM 分析工具也可以提供获取 JVM 基本信息、追踪堆栈、获取内存信息等功能,但同样需要命令行 CLI 的支持。

UAVStack 推出的 JVM 监控分析工具提供基于页面的展现方式,以图形化的方式展示采集到的监控数据;同时提供 JVM 基本参数获取、内存 dump、线程分析、内存分配采样和热点方法分析等功能。

一、架构

JVM 监控分析工具基于 UAVStack 既有架构,整体分为前端、后台及中间件增强框架(MOF)。其中:

  • 前端负责展示数据、向后台发送用户执行指令;
  • 后台负责下发指令、响应用户查询、处理采集到的数据;
  • 中间件增强框架(MOF)负责接收后台下发的指令、执行指令并返回数据或将数据写入文件,然后通过 UAV 提供的文件归集功能上送数据。

整体架构流程如下图所示:

二、关键技术

2.1 JMX

JMX 提供相关接口,获取基础的 JVM 监控数据,如内存堆大小、GC 情况等,是 JVM 监控数据的基础。

2.2 中间件增强框架(MOF)

作为分析工具整条链路的基础,MOF 依附于用户应用,主要提供以下基础支持:

  • 基础数据采集:MOF 植入应用中,JMX 定期获取并上报相关 JVM 的基本信息数据,为展示和预警提供数据基础。
  • 请求捕获、指令执行:JVM 监控分析工具的大多数功能都需要下发指令至应用所在的服务器。MOF 负责把下发指令的请求拦截下来,执行并返回对应的结果。

2.3 Java Attach API

Java Attach API 是由 Sun 提供的一套非标准 API,可以将用户连接到运行中的虚拟机进程上,进行 agent 的挂载等操作。

在 JVM 监控分析工具中,Java Attach API 主要用于 Attach 到虚拟机进程,进行如下操作:

  • 获取 JMX Connection:从外部获取 JVMConnection,得到 MXBean,抓取运行数据。(CPU 采样分析)
  • 获取 VirtualMachine 对象:调用接口,得到堆内存分布信息。(内存采样分析)

三、功能展示

3.1 基本监控

选择应用实例后即可进入基本监控页面。

该页面主要展示 CPU 使用率、线程情况、内存占用和 GC 情况。用户可以根据需求调整时间范围,查看不同时段的监控数据。

3.2 JVM 摘要

JVM 摘要页面显示当前虚拟机的基本参数信息,包括基本信息、JVM 参数和系统属性。其中:

  • 基本信息包括 pid、主机信息、启动参数以及 JVM 的启动时间等最基本、最重要的信息;
  • JVM 参数包括所有 JVM 启动参数,用户可查看指定的堆大小、垃圾回收器信息等;
  • 系统属性包括写入 System.Properties 中的所有配置信息以及 Javaagent 的配置属性。

3.3 线程分析

线程分析通过执行 jstack 获取线程基本信息,并对输出结果进行分析,得到线程状态数量、有无死锁等信息。

3.4 内存 Dump

内存 Dump 通过执行 jmap 获取指定 JVM 的堆栈 dump 文件。

用户可以便捷地在前端一键生成 dump,不需要再登录堡垒机。点击“刷新”可以查看近期 dump 内存的操作记录。

3.5 CPU 分析

CPU 分析是基于线程栈的采样分析,主要提供两个功能:线程执行时间以及方法热点采样。

  • 线程执行时间是指线程在采样期间的活动时间。查询结果按照线程活动总时间排序,同时提供线程名称和线程执行时间信息,用户可据此判断应用的执行情况。

  • 方法热点采样统计所有方法的执行时间,提供方法的类名和方法名信息。其中,方法的自用执行时间不包括方法调用其他方法的执行时间。查询结果按照方法的自用执行时间降序排序,用户可以查看当前应用内部耗时较长的执行方法,判断应用是否异常、是否需要优化。

3.6 内存分析

内存分析是基于线程以及堆的统计采样分析,主要提供两个功能:每个线程的内存分配和堆内分配细节。

  • 线程内存分配提供每个线程的内存分配大小和线程名称等信息,按照内存分配大小降序排列。用户可查看当前占用内存较大的线程。

  • 堆内分配提供了各个类在堆内的分配实例数以及所占用的堆内存,按照堆内存大小降序排列。用户可把该功能当作简易的 dump 及分析工具,快速分析内存分配情况,发现内存分配问题。

总结

JVM 监控分析工具是从监控、分析到展示的一体化工具。JDK 自带的工具虽然也可以实现除 CPU 分析之外的其他功能,但不够便捷,也无法实现从采样、分析到图形化展示的一体化效果。JVM 监控分析工具解决了开发人员没有线上应用堡垒机权限、无法分析采集到的数据等痛点,同时提供 CPU 与内存采样分析等功能,以较低的性能开销获取较为全面的 JVM 运行数据,帮助应用开发人员发现与分析问题,为应用开发优化提供参考依据。

UAVStack 已在 Github 上开放源码,并提供了安装部署、架构说明和用户指南等双语文档。

官方网站:https://uavorg.github.io/main/

开源地址:https://github.com/uavorg

作者:张明明

首发于:UAVStack 智能运维

正文完
 0