乐趣区

关于java:阿里排查神器太强了

本文曾经收录到 Github 仓库,该仓库蕴含 计算机根底、Java 根底、多线程、JVM、数据库、Redis、Spring、Mybatis、SpringMVC、SpringBoot、分布式、微服务、设计模式、架构 等外围知识点,欢送 star~

Github 地址:https://github.com/Tyson0314/…

Gitee 地址:https://gitee.com/tysondai/Ja…

简介

Arthas 是 Alibaba 开源的 Java 诊断工具,动静跟踪 Java 代码;实时监控 JVM 状态,能够在不中断程序执行的状况下轻松实现 JVM 相干问题排查工作。反对 JDK 6+,反对 Linux/Mac/Windows。这个工具真的很好用,而且入门超简略,非常举荐。

应用场景

  1. 这个类从哪个 jar 包加载的?为什么会报各种类相干的 Exception?
  2. 我改的代码为什么没有执行到?难道是我没 commit?分支搞错了?
  3. 遇到问题无奈在线上 debug,难道只能通过加日志再从新公布吗?
  4. 线上遇到某个用户的数据处理有问题,但线上同样无奈 debug,线下无奈重现!
  5. 是否有一个全局视角来查看零碎的运行状况?
  6. 有什么方法能够监控到 JVM 的实时运行状态?接下来,围绕这 6 个问题,学习下 Arthas 的根本用法。

装置

执行上面命令下载

wget https://alibaba.github.io/arthas/arthas-boot.jar

用 java -jar 的形式启动

java -jar arthas-boot.jar

[INFO] Found existing java process, please choose one and hit RETURN.
* [1]: 79952 cn.test.MobileApplication
  [2]: 93872 org.jetbrains.jps.cmdline.Launcher

而后输出数字,抉择你想要监听的利用,回车即可

常用命令

查问 arthas 版本

[arthas@79952]$ version
3.1.4

1、stack

输入以后办法被调用的调用门路

很多时候咱们都晓得一个办法被执行,然而有很多中央调用了它,你并不知道是谁调用了它,此时你须要的是 stack 命令。

参数名称 参数阐明
class-pattern 类名表达式匹配
method-pattern 办法名表达式匹配
[arthas@79952]$ stack com.baomidou.mybatisplus.extension.service.IService getOne
Press Q or Ctrl+C to abort.
Affect(class-cnt:202 , method-cnt:209) cost in 10761 ms.
ts=2019-11-13 11:49:13;thread_name=http-nio-8801-exec-6;id=2d;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@a6c54c3
    @com.baomidou.mybatisplus.extension.service.impl.ServiceImpl.getOne()
        at com.baomidou.mybatisplus.extension.service.IService.getOne(IService.java:230)
        ...... ......
        at cn.test.mobile.controller.order.OrderController.getOrderInfo(OrderController.java:500)

能够看到 OrderController.java 的第 500 行调用了这个 getOne 接口。

留神这个命令须要调用后才会触发日志,类似的还有 watch、trace 等

2、jad

反编译指定已加载类的源码

有时候,版本公布后,代码居然没有执行,代码是最新的吗,这时能够应用 jad 反编译相应的 class。

jad cn.test.mobile.controller.order.OrderController

仅编译指定的办法

jad cn.test.mobile.controller.order.OrderController getOrderInfo

ClassLoader:
@RequestMapping(value={"getOrderInfo"}, method={RequestMethod.POST})
public Object getOrderInfo(HttpServletRequest request, @RequestBody Map map) {ResponseVo responseVo = new ResponseVo();
    ... ... ...  ...

3、sc

“Search-Class”的简写,查看 JVM 已加载的类信息 有的时候,你只记得类的局部关键词,你能够用 sc 获取残缺名称 当你碰到这个错的时候“ClassNotFoundException”或者“ClassDefNotFoundException”,你能够用这个命令验证下

参数名称 参数阐明
class-pattern 类名表达式匹配
method-pattern 办法名表达式匹配
[d] 输入以后类的详细信息,包含这个类所加载的原始文件起源、类的申明、加载的 ClassLoader 等详细信息。如果一个类被多个 ClassLoader 所加载,则会呈现屡次

含糊搜寻

sc *OrderController*
cn.test.mobile.controller.order.OrderController

打印类的详细信息 sc -d

sc -d cn.test.mobile.controller.order.OrderController

 class-info        cn.test.mobile.controller.order.OrderController
 code-source       /F:/IDEA-WORKSPACE-TEST-qyb/trunk/BE/mobile/target/classes/
 name              cn.test.mobile.controller.order.OrderController
 isInterface       false
 isAnnotation      false
 isEnum            false
 isAnonymousClass  false
 isArray           false
 isLocalClass      false
 isMemberClass     false
 isPrimitive       false
 isSynthetic       false
 simple-name       OrderController
 modifier          public
 annotation        org.springframework.web.bind.annotation.RestController,org.springframework.web.bind.annotation.Requ
                   estMapping
 interfaces
 super-class       +-cn.test.mobile.controller.BaseController
                     +-java.lang.Object
 class-loader      +-sun.misc.Launcher$AppClassLoader@18b4aac2
                     +-sun.misc.Launcher$ExtClassLoader@480bdb19
 classLoaderHash   18b4aac2
与之相应的还有 sm(“Search-Method”),查看已加载类的办法信息

查看 String 里的办法

sm java.lang.String
java.lang.String <init>([BII)V
java.lang.String <init>([BLjava/nio/charset/Charset;)V
java.lang.String <init>([BLjava/lang/String;)V
java.lang.String <init>([BIILjava/nio/charset/Charset;)V
java.lang.String <init>([BIILjava/lang/String;)V
... ... ... ...

查看 String 中 toString 的详细信息

sm -d java.lang.String toString
declaring-class  java.lang.String
 method-name      toString
 modifier         public
 annotation
 parameters
 return           java.lang.String
 exceptions
 classLoaderHash  null

4、watch

能够监测一个办法的入参和返回值

有些问题线上会呈现,本地重现不了,这时这个命令就有用了

参数名称 参数阐明
class-pattern 类名表达式匹配
method-pattern 办法名表达式匹配
express 察看表达式
condition-express 条件表达式
[b] 办法调用之前 察看
[e] 办法异样之后 察看
[s] 办法返回之后 察看
[f] 办法完结之后 (失常返回和异样返回) 察看,默认选项
[E] 开启正则表达式匹配,默认为通配符匹配
[x:] 指定输入后果的属性遍历深度,默认为 1

察看 getOrderInfo 的出参和返回值,出参就是办法完结后的入参

watch cn.test.mobile.controller.order.OrderController getOrderInfo "{params,returnObj}" -x 2

Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 456 ms.
ts=2019-11-13 15:30:18; [cost=18.48307ms] result=@ArrayList[@Object[][  # 这个就是出参,params
        @RequestFacade[org.apache.catalina.connector.RequestFacade@1d81dbd7],
        @LinkedHashMap[isEmpty=false;size=2], # 把遍历深度 x 改为 3 就能够查看 map 里的值了
    ],
    @ResponseVo[ # 这个就是返回值 returnObj
        log=@Logger[Logger[cn.test.db.common.vo.ResponseVo]],
        success=@Boolean[true],
        message=@String[Ok],
        count=@Integer[0],
        code=@Integer[1000],
        data=@HashMap[isEmpty=false;size=1],
    ],
]

察看 getOrderInfo 的入参和返回值

watch cn.test.mobile.controller.order.OrderController getOrderInfo "{params,returnObj}" -x 3 -b

Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 93 ms.
ts=2019-11-13 15:37:38; [cost=0.012479ms] result=@ArrayList[@Object[][
        @RequestFacade[request=@Request[org.apache.catalina.connector.Request@d04e652],
            sm=@StringManager[org.apache.tomcat.util.res.StringManager@7ae7a97b],
        ],
        @LinkedHashMap[@String[payNo]:@String[190911173713755288],
            @String[catalogId]:@String[6],
        ],
    ],
    null,# - b 是办法调用之前察看,所以还没有返回值
]

如果须要捕获异样的话,应用 throwExp,如{params,returnObj,throwExp}

5、trace

输入办法外部调用门路,和门路上每个节点的耗时

能够通过这个命令,查看哪些办法耗性能,从而找出导致性能缺点的代码,这个耗时还蕴含了 arthas 执行的工夫哦。

参数名称 参数阐明
class-pattern 类名表达式匹配
method-pattern 办法名表达式匹配
condition-express 条件表达式
[E] 开启正则表达式匹配,默认为通配符匹配
[n:] 命令执行次数
#cost 办法执行耗时

输入 getOrderInfo 的调用门路

trace -j cn.test.mobile.controller.order.OrderController getOrderInfo

Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 92 ms.
---ts=2019-11-13 15:46:59;thread_name=http-nio-8801-exec-4;id=2b;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@a6c54c3
    ---[15.509011ms] cn.test.mobile.controller.order.OrderController:getOrderInfo()
        +---[0.03584ms] cn.test.db.common.vo.ResponseVo:<init>() #472
        +---[0.00992ms] java.util.HashMap:<init>() #473
        +---[0.02176ms] cn.test.mobile.controller.order.OrderController:getUserInfo() #478
        +---[0.024ms] java.util.Map:get() #483
        +---[0.00896ms] java.lang.Object:toString() #483
        +---[0.00864ms] java.lang.Integer:parseInt() #483
        +---[0.019199ms] com.baomidou.mybatisplus.core.conditions.query.QueryWrapper:<init>() #500
        +---[0.135679ms] com.baomidou.mybatisplus.core.conditions.query.QueryWrapper:allEq() #500
        +---[12.476072ms] cn.test.db.service.IOrderMediaService:getOne() #500
        +---[0.0128ms] java.util.HashMap:put() #501
        +---[0.443517ms] cn.test.db.common.vo.ResponseVo:setSuccess() #503
        `---[0.03488ms] java.util.Map:put() #504

输入 getOrderInfo 的调用门路,且 cost 大于 10ms,- j 是指过滤掉 jdk 中的办法,能够看到输入少了很多

trace -j cn.test.mobile.controller.order.OrderController getOrderInfo '#cost > 10'

Press Q or Ctrl+C to abort.
Affect(class-cnt:1 , method-cnt:1) cost in 96 ms.
---ts=2019-11-13 15:53:42;thread_name=http-nio-8801-exec-2;id=29;is_daemon=true;priority=5;TCCL=org.springframework.boot.web.embedded.tomcat.TomcatEmbeddedWebappClassLoader@a6c54c3
    ---[13.803743ms] cn.test.mobile.controller.order.OrderController:getOrderInfo()
        +---[0.01312ms] cn.test.db.common.vo.ResponseVo:<init>() #472
        +---[0.01408ms] cn.test.mobile.controller.order.OrderController:getUserInfo() #478
        +---[0.0128ms] com.baomidou.mybatisplus.core.conditions.query.QueryWrapper:<init>() #500
        +---[0.303998ms] com.baomidou.mybatisplus.core.conditions.query.QueryWrapper:allEq() #500
        +---[12.675431ms] cn.test.db.service.IOrderMediaService:getOne() #500
        `---[0.409917ms] cn.test.db.common.vo.ResponseVo:setSuccess() #503

6、jobs

执行后盾异步工作

线上有些问题是偶尔产生的,这时就须要应用异步工作,把信息写入文件。

应用 & 指定命令去后盾运行,应用 > 将后果重写到日志文件,以 trace 为例

trace -j cn.test.mobile.controller.order.OrderController getOrderInfo > test.out &

jobs——列出所有 job

 jobs
[76]*  
       Running           trace -j cn.test.mobile.controller.order.OrderController getOrderInfo >> test.out &
       execution count : 0
       start time      : Wed Nov 13 16:13:23 CST 2019
       timeout date    : Thu Nov 14 16:13:23 CST 2019
       session         : f4fba846-e90b-4234-959e-e78ad0a5db8c (current)

job id 是 76, * 示意此 job 是以后 session 创立,状态是 Running,execution count 是执行次数,timeout date 是超时工夫

异步执行工夫,默认为 1 天,如果要批改,应用 options 命令,

options job-timeout 2d

options 可选参数 1d, 2h, 3m, 25s,别离代表天、小时、分、秒

kill——强制终止工作

kill 76
kill job 76 success

最多同时反对 8 个命令应用重定向将后果写日志

请勿同时开启过多的后盾异步命令,免得对指标 JVM 性能造成影响

7、logger

查看 logger 信息,更新 logger level

查看

logger
 name                ROOT
 class               ch.qos.logback.classic.Logger
 classLoader         sun.misc.Launcher$AppClassLoader@18b4aac2
 classLoaderHash     18b4aac2 #改日志级别时要用到它
 level               INFO
 effectiveLevel      INFO
 ... ... ... ...

更新日志级别

logger --name ROOT --level debug
update logger level success.

如果执行这个命令时出错:update logger level fail.

指定 classLoaderHash 重试一下试试

logger -c 18b4aac2 --name ROOT --level debug
update logger level success.

8、dashboard

查看以后零碎的实时数据面板 这个命令能够全局的查看 jvm 运行状态,比方内存和 cpu 占用状况

dashboard
ID        NAME                          GROUP               PRIORITY STATE     %CPU      TIME      INTERRUPT DAEMON
17        Abandoned connection cleanup  main                5        TIMED_WAI 0         0:0       false     true
1009      AsyncAppender-Worker-arthas-c system              5        WAITING   0         0:0       false     true
5         Attach Listener               system              5        RUNNABLE  0         0:0       false     true
23        ContainerBackgroundProcessor[ main                5        TIMED_WAI 0         0:0       false     true
55        DestroyJavaVM                 main                5        RUNNABLE  0         0:11      false     false
3         Finalizer                     system              8        WAITING   0         0:0       false     true
18        HikariPool-1 housekeeper      main                5        TIMED_WAI 0         0:0       false     true
39        NioBlockingSelector.BlockPoll main                5        RUNNABLE  0         0:0       false     true
2         Reference Handler             system              10       WAITING   0         0:0       false     true
4         Signal Dispatcher             system              9        RUNNABLE  0         0:0       false     true
69        System Clock                  main                5        TIMED_WAI 0         0:34      false     true
25        Thread-2                      main                5        TIMED_WAI 0         0:0       false     false
37        Timer-0                       main                5        TIMED_WAI 0         0:0       false     true
Memory                    used    total    max     usage    GC
heap                      216M    415M     3614M   5.99%    gc.ps_scavenge.count          96
ps_eden_space             36M     78M      1276M   2.90%    gc.ps_scavenge.time(ms)       3054
ps_survivor_space         17M     38M      38M     46.53%   gc.ps_marksweep.count         4
ps_old_gen                161M    298M     2711M   5.97%    gc.ps_marksweep.time(ms)      804
nonheap                   175M    180M     -1      97.09%
code_cache                35M     35M      240M    14.85%

ID: Java 级别的线程 ID,留神这个 ID 不能跟 jstack 中的 nativeID 一一对应 咱们能够通过 thread id 查看线程的堆栈 信息

thread 2
"Reference Handler" Id=2 WAITING on java.lang.ref.Reference$Lock@66ad4272
    at java.lang.Object.wait(Native Method)
    -  waiting on java.lang.ref.Reference$Lock@66ad4272
    at java.lang.Object.wait(Object.java:502)
    at java.lang.ref.Reference.tryHandlePending(Reference.java:191)
    at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:153)

NAME: 线程名

GROUP: 线程组名

PRIORITY: 线程优先级, 1~10 之间的数字,越大示意优先级越高

STATE: 线程的状态

CPU%: 线程耗费的 cpu 占比,采样 100ms,将所有线程在这 100ms 内的 cpu 使用量求和,再算出每个线程的 cpu 应用占比。

TIME: 线程运行总工夫,数据格式为分:秒

INTERRUPTED: 线程以后的中断位状态

DAEMON: 是否是 daemon 线程

9、redefine

redefine jvm 已加载的类,能够在不重启我的项目的状况下,热更新类。

这个性能真的很弱小,然而命令不肯定会胜利

上面咱们来模仿:假如我想批改 OrderController 里的某几行代码,而后热更新至 jvm:

a. 反编译 OrderController,默认状况下,反编译后果里会带有 ClassLoader 信息,通过 –source-only 选项,能够只打印源代码。不便和 mc/redefine 命令联合应用

jad --source-only cn.test.mobile.controller.order.OrderController > OrderController.java

生成的 OrderController.java 在哪呢,执行 pwd 就晓得在哪个目录了

b. 查找加载 OrderController 的 ClassLoader

sc -d cn.test.mobile.controller.order.OrderController | grep classLoaderHash
classLoaderHash   18b4aac2

c. 批改保留好 OrderController.java 之后,应用 mc(Memory Compiler)命令来编译成字节码,并且通过 - c 参数指定 ClassLoader

mc -c 18b4aac2 OrderController.java -d ./

d. 热更新方才批改后的代码

redefine -c 18b4aac2 OrderController.class
redefine success, size: 1

而后代码就更新胜利了。

其余

如果 java -jar 抉择启动某个利用的时候,报上面的错

java -jar arthas-boot.jar
[INFO] arthas-boot version: 3.1.4
[INFO] Process 11544 already using port 3658
[INFO] Process 11544 already using port 8563
[INFO] Found existing java process, please choose one and hit RETURN.
* [1]: 11544
  [2]: 119504 cn.test.MobileApplication
  [3]: 136340 org.jetbrains.jps.cmdline.Launcher
  [4]: 3068
2 #抉择第 2 个启动
[ERROR] Target process 119504 is not the process using port 3658, you will connect to an unexpected process.
[ERROR] 1. Try to restart arthas-boot, select process 11544, shutdown it first with running the 'shutdown' command.
[ERROR] 2. Or try to use different telnet port, for example: java -jar arthas-boot.jar --telnet-port 9998 --http-port -1

留神提醒[ERROR] 1,只须要进入 11544 这个利用,而后执行 shutdown 敞开这个利用就能够启动了

最初给大家分享一个 Github 仓库,下面有大彬整顿的 300 多本经典的计算机书籍 PDF,包含 C 语言、C++、Java、Python、前端、数据库、操作系统、计算机网络、数据结构和算法、机器学习、编程人生 等,能够 star 一下,下次找书间接在下面搜寻,仓库继续更新中~

Github 地址:https://github.com/Tyson0314/…

退出移动版