关于java:对乱糟糟的日志说再见

9次阅读

共计 3957 个字符,预计需要花费 10 分钟才能阅读完成。

前言

最近一个敌人老是和我埋怨:公司系统日志打的切实是太烂了,有用的信息很少,没用的一大堆。就连那有用的信息,在那么多节点日志之间进行追究,也是苦楚的一笔。

我问他,公司没有日志收集吗,日志收集起来看总好过一个节点一个节点日志查看。他示意,公司有接入一个免费第三方的日志产品,做了收集。然而仅仅是不便了统一化查看搜寻,然而零碎自身的日志短少一些关键性的因素。比拟乱,在很多微服务之间查看调用日志时定位很难。

演绎下来问题有以下几点:

  • 并非所有的日志有关键性信息,比方订单号和 SKU 信息,有些日志有,有些日志没有,导致有些日志尽管打出了解决步骤日志,然而并不知道是解决哪一个对象。
  • 日志没有对立标准,导致看起来十分横七竖八
  • 微服务之间同一个申请的调用链追究更加苦楚,往往只能依据工夫戳去搜寻,并发小的时候,通过工夫戳还能查到,并发一大,查问题的老本太大了。

我给他举荐了一些分布式追踪框架,skywalking,pinpoint。他看过之后示意,很欠缺,然而搭建和推广老本有点大。还波及到存储老本,公司曾经购买了第三方的日志服务。对接起来还是有点麻烦的。恐怕下面不批准这么折腾。

近段时间,在开源社区看到这么一款开源框架,号称是轻量级的日志追踪神器,10 分钟接入,于是我举荐了给了敌人。过了几日,他和我示意这个货色十分贴切他当初的痛点,当初曾经上生产,初步成果来看,还是十分称心的。能给他们的日志定位缩小工夫老本。

我的项目个性

受邀请,所以我打算来剖析下这款框架。给大家一个直观的了解。

这个框架叫 TLog,我的项目托管在 Gitee 上

https://gitee.com/dromara/TLog

主页长这样,浓浓的一股暗黑系。。。

我应用下来,直白点的说,就是 TLog 为每一行日志主动打了前缀,也就是所谓的 标签。标签分为零碎级标签和业务型标签,其中业务型标签开发者能够自定义。画了张图便于了解:

TLog 最终出现的每行日志,就如同上图所示。其中系统日志,可能展示的信息目前有 5 个,上游信息可能让你晓得是谁调用了你的零碎,链路 TraceId 则是跨微服务的全局链路惟一 ID,搜寻一个 Id,就能失去所有零碎中同一申请的日志。这个还是很香的!

对于 SpanId,官网的解释是,这是一个代表本次调用在整个调用链路树中的地位,具体演示借用下官网的图,解释的还算清晰:

集体对 SpanId 的了解是,这个货色能够让你晓得零碎在某一个调用链中的层级,如果加以收集,能够通过 spanId 生成一棵调用链路树。其实很心愿 TLog 能实现这个树的展现,惋惜当初还不反对。

“TLog 的定位是提供了一种最简略的形式来解决日志追踪问题,它不收集日志,也不须要另外的存储空间,它只是主动的对你的业务日志进行打标签,主动生成 TraceId 贯通你微服务的一整条链路。并且提供上下游节点信息。适宜中小型企业以及想疾速解决日志追踪问题的公司我的项目应用。“

这是官网的赘述,事实上我在测试的时候,TLog 所提供的日志就是日志自身,在多节点微服务当中,日志还是扩散的。只是在逻辑上给日志进行肯定水平的串联。然而同时,TLog 文档也倡议说,利用其它的计划去做日志收集。比方 ELK,阿里云日志,其它免费的日志产品等等。TLog 只是批改日志,并不生成新的日志。所以对接其它日志收集计划,也是齐全没有任何问题的,对于曾经对接日志收集计划的公司来说,也齐全不须要批改什么。

反对的日志框架

每个公司所用的日志框架不拘一格。TLog 声称反对了支流的三大日志框架:log4j,log4j2,logback

理论测试中,在这 3 个框架中,TLog 也都可能失常打印出标签。只是在接入过程中,官网给出的接入形式有 3 种

测试下来,javaagent 的形式对于有些我的项目确实不太稳固,有些简单的我的项目会呈现有效的状况。对于声称最稳固的日志适配形式,测试了一下公司的我的项目,确实能顺利接入。

接入形式,依照文档一步步来就能够了。

反对的 RPC 框架

既然是跨微服务进行日志追踪,在实现方面也要对罕用的 RPC 进行反对。TLog 反对了 Dubbo,SpringCloud,Dubbox 三种罕用的 RPC,这点还是不错的。

理论测试中,在 Spring cloud 这块,TLog 还反对了 SpringCloud 的 Gateway。

在接入过程中,无论是哪种 RPC 框架,在 springboot 环境下 TLog 也能主动适配,引入一个就能主动拆卸。无需额定的配置。这点很不便。

然而在原生 spring 环境下(非 springboot),还是须要 xml 的额定配置的,然而也绝对简略,文档也有专门的阐明。

业务标签

除了零碎给予的标签外,我发现 TLog 另一大特点就是容许开发者自定义标签。接入也很简略,举个例子:

@TLogAspect({"str","user.name","user.userDetail.company","user.dddd"})
    public void test(String str, User user){log.info("这是自定义表白标签");
        log.info("这是业务日志 1");
        log.info("这是业务日志 2");
        log.info("这是业务日志 3");
        log.info("这是业务日志 4");
        log.info("这是业务日志 5");
    }

只有在办法上加一个标签,那么这个办法上面所有的日志,包含之后的 N 个层级,都会主动加上你定义的标签

这个性能在对日志的排版和查找上,又能减少很多个标记。这个很赞!

甚至于自定义标签还反对对信息的逻辑解决,能够自定义类去解决这些信息

@TLogAspect(convert = CustomAspectLogConvert.class)
public void demo(Person person){log.info("自定义 Convert 示例");
}

这个具体成果,大家能够去试试。总之一个标签搞定所有的自定义标签。

其余场景的反对

参数 & 耗时打印反对:

引入了 TLog 之后,发现 TLog 还附带了无论在哪种框架之下每个办法的参数打印和耗时,默认为敞开,须要的只须要配置下就能够了:

tlog.enableInvokeTimePrint=true

进去的成果如下:

异步线程 & 线程池的反对

如果你的我的项目有异步线程,对于标签传递的连贯性,也是主动反对的,没有任何问题。

然而对于线程池场景,TLog 并没有原生反对。然而提供了一个辅助类,须要大量的侵入代码。这点还有待改善。

MQ 反对

同样的,TLog 也思考到了 MQ 场景标签的传递。这个也须要大量的侵入代码。如果你什么都不改,则在 MQ 场景下无奈反对。

性能

对于性能,我对 TLog 进行了简略的测试,只在 log4j2 的环境下进行了测试,测试条件是同步打印出几 w 条日志,在原生环境下的耗时和退出 TLog 框架之后的耗时比照,每组别离测 10 次,取平均值

测试代码非常简单:

StopWatch stopWatch = new StopWatch();
stopWatch.start();
for (int i = 0; i < 100; i++) {log.info("test log {}", i+1);
}
stopWatch.stop();
log.info("耗时:{}",stopWatch.getTotalTimeSeconds());

不加 TLog

打印 5w 条日志(秒) 打印 10w 条日志(秒)
第 1 次 6.496249974 15.595447718
第 2 次 6.185712521 14.295489162
第 3 次 6.116123718 13.559289437
第 4 次 6.205771261 12.782565374
第 5 次 6.727208117 12.884360048
第 6 次 5.908489157 14.604699842
第 7 次 6.153151066 13.700609245
第 8 次 6.603960836 13.048889457
第 9 次 6.139718196 12.584335736
第 10 次 6.365920588 12.85222910
均匀 6.29 13.60

退出 TLog

打印 5w 条日志(秒) 打印 10w 条日志(秒)
第 1 次 5.997981416 12.878389572
第 2 次 6.154590093 14.268328625
第 3 次 6.228010581 12.385200456
第 4 次 6.452949788 15.542794904
第 5 次 6.156225995 12.350440713
第 6 次 6.121611887 12.543883453
第 7 次 6.18131273 12.192140225
第 8 次 6.238254682 12.159684042
第 9 次 6.403632588 12.308115127
第 10 次 5.954781153 12.321667925
均匀 6.19 12.89

测试后果有点出其不意,加了 TLog 后 10 次均匀下来反而比不加要快第一点。然而我揣测应该是测试环境和样本数量太少的问题,并不是说加反而比不加要快。只能说,如果进行 100 次,1000 次测试。2 者应该是差不多的。

从这个性能测试也侧面反映了,TLog 不会给零碎带来额定的开销。这点也赞一下。

总结

这次评测这款开源框架 TLog 总体上还算是个日志框架,然而集成了分布式追踪,日志标签和其余一些小性能还算是一个蛮有特色的 Java 开源我的项目,从构造上来说,它十分玲珑,而且性能也十分优越。从实用性上来说,它解决了在中小公司疾速定位日志的痛点。毛病是不收集日志,无奈做更无效的日志开掘,然而这也是 TLog 号称 10 分钟接入的起因。从主观上来剖析,这无利也有弊。心愿 TLog 在之后可能欠缺这一部分的性能。

对于我

我是一个开源作者,也是一名内容创作者。「元人部落」是一个保持做原创的技术科技分享号,会始终分享原创的技术文章,陪你一起成长。

正文完
 0