关于java:Elasticsearch-Logstash-Kibana搭建ELK日志分析平台官方推荐的BEATS架构

俗话话说的号，没有金刚钻，也不揽那瓷器活；日志剖析能够说是所有大小零碎的标配了，不晓得有多少菜鸟程序员有多喜爱日志，如果没了日志，那本人写的bug想不被他人发现，可就难了；
有了它，就可将bug们通通消化在本人手里。

当然了，作为一个架构师搭建入手搭建一个日志平台也根本是必备技能了，尽管咱们说架构师根本不咋写代码了，然而如果须要的时候，还是能扛枪的

大家能够看下架构师要具备的能力：
那些年薪50万，却不写代码的程序员，到底赢在哪？
原来，百万年薪的架构师都是这样应用redis的！

ELK部署利用与工作机制

3.1 ELK日志剖析平台介绍

ELK是三个开源软件的缩写，别离示意：Elasticsearch , Logstash和Kibana。Elasticsearch和Kibana咱们下面做过解说。 Logstash 次要是用来日志的收集、剖析、过滤日志的工具，实用大数据量场景，个别采纳c/s模式，client端装置在须要收集日志的主机上，server端负责将收到的各节点日志进行过滤、批改等操作，再一并发往Elasticsearch上做数据分析。

一个残缺的集中式日志零碎，须要蕴含以下几个次要特点：

收集－可能采集多种起源的日志数据
传输－可能稳固的把日志数据传输到地方零碎
存储－如何存储日志数据
剖析－能够反对 UI 剖析
正告－可能提供错误报告，监控机制

ELK提供了一整套解决方案，并且都是开源软件，之间互相配合应用，完满连接，高效的满足了很多场合的利用，是目前支流的一种日志剖析平台。

3.2 ELK部署架构模式

3.2.1 简略架构

这是最简略的一种ELK部署架构形式，由Logstash散布于各个节点上收集相干日志、数据，并通过剖析、过滤后发送给远端服务器上的Elasticsearch进行存储。长处是搭建简略，易于上手，毛病是Logstash耗资源较大，依赖性强，没有音讯队列缓存，存在数据失落隐患

3.2.2 音讯队列架构

该队列架构引入了KAFKA音讯队列，解决了各采集节点上Logstash资源消耗过大，数据失落的问题，各终端节点上的Logstash Agent 先将数据/日志传递给Kafka，音讯队列再将数据传递给Logstash， Logstash过滤、剖析后将数据传递给Elasticsearch存储，由Kibana将日志和数据出现给用户。

3.2.3 BEATS架构

该架构的终端节点采纳Beats工具收集发送数据，更灵便，耗费资源更少，扩展性更强。同时可配置Logstash 和Elasticsearch 集群用于反对大集群零碎的运维日志数据监控和查问，官网也举荐采纳此工具，本章咱们采纳此架构模式进行配置解说（如果在生产环境中，能够再减少kafka音讯队列，实现了beats+音讯队列的部署架构）。

Beats工具蕴含四种：

1、Packetbeat（收集网络流量数据）

2、Topbeat（收集零碎、过程和文件系统级别的 CPU 和内存应用状况等数据）

3、Filebeat（收集文件数据）

4、Winlogbeat（收集 Windows 事件日志数据）

3.3 ELK工作机制

3.3.1 Filebeat工作机制

Filebeat由两个次要组件组成：prospectors 和 harvesters。这两个组件协同工作将文件变动发送到指定的输入中。

Harvester（收割机）：负责读取单个文件内容。每个文件会启动一个Harvester，每个Harvester会逐行读取各个文件，并将文件内容发送到制订输入中。Harvester负责关上和敞开文件，象征在Harvester运行的时候，文件描述符处于关上状态，如果文件在收集中被重命名或者被删除，Filebeat会持续读取此文件。所以在Harvester敞开之前，磁盘不会被开释。默认状况filebeat会放弃文件关上的状态，直到达到close_inactive

filebeat会在指定工夫内将不再更新的文件句柄敞开，工夫从harvester读取最初一行的工夫开始计时。若文件句柄被敞开后，文件发生变化，则会启动一个新的harvester。敞开文件句柄的工夫不取决于文件的批改工夫，若此参数配置不当，则可能产生日志不实时的状况，由scan_frequency参数决定，默认10s。Harvester应用外部工夫戳来记录文件最初被收集的工夫。例如：设置5m，则在Harvester读取文件的最初一行之后，开始倒计时5分钟，若5分钟内文件无变动，则敞开文件句柄。默认5m】。

Prospector（勘测者）：负责管理Harvester并找到所有读取源。

filebeat.prospectors:
- input_type: log
  paths:
    - /apps/logs/*/info.log

Prospector会找到/apps/logs/*目录下的所有info.log文件，并为每个文件启动一个Harvester。Prospector会查看每个文件，看Harvester是否曾经启动，是否须要启动，或者文件是否能够疏忽。若Harvester敞开，只有在文件大小发生变化的时候Prospector才会执行查看。只能检测本地的文件。

Filebeat如何记录发送状态：

将文件状态记录在文件中（默认在/var/lib/filebeat/registry）。此状态能够记住Harvester收集文件的偏移量。若连贯不上输出设备，如ES等，filebeat会记录发送前的最初一行，并再能够连贯的时候持续发送。Filebeat在运行的时候，Prospector状态会被记录在内存中。Filebeat重启的时候，利用registry记录的状态来进行重建，用来还原到重启之前的状态。每个Prospector会为每个找到的文件记录一个状态，对于每个文件，Filebeat存储惟一标识符以检测文件是否先前被收集。

Filebeat如何保证数据发送胜利：

Filebeat之所以能保障事件至多被传递到配置的输入一次，没有数据失落，是因为filebeat将每个事件的传递状态保留在文件中。在未失去输出方确认时，filebeat会尝试始终发送，直到失去回应。若filebeat在传输过程中被敞开，则不会再敞开之前确认所有时事件。任何在filebeat敞开之前未确认的事件，都会在filebeat重启之后从新发送。这可确保至多发送一次，但有可能会反复。可通过设置shutdown_timeout 参数来设置敞开之前的期待事件回应的工夫（默认禁用）。

3.3.2 Logstash工作机制

Logstash事件处理有三个阶段：inputs → filters → outputs。是一个接管，解决，转发日志的工具。反对系统日志，webserver日志，谬误日志，利用日志等。

Input：输出数据到logstash。

反对的输出类型：

file：从文件系统的文件中读取，相似于tail -f命令

syslog：在514端口上监听系统日志音讯，并依据RFC3164规范进行解析

redis：从redis service中读取

beats：从filebeat中读取

Filters：数据两头解决，对数据进行操作。

一些罕用的过滤器为：

grok：解析任意文本数据，Grok 是 Logstash 最重要的插件。它的次要作用就是将文本格式的字符串，转换成为具体的结构化的数据，配合正则表达式应用。内置120多个解析语法。

官网提供的grok表达式

mutate：对字段进行转换。例如对字段进行删除、替换、批改、重命名等。

drop：抛弃一部分events不进行解决。

clone：拷贝 event，这个过程中也能够增加或移除字段。

geoip：增加地理信息(为前台kibana图形化展现应用)

Outputs：outputs是logstash解决管道的最末端组件。

一个event能够在处理过程中通过多重输入，然而一旦所有的outputs都执行完结，这个event也就实现生命周期。

常见的outputs为：

elasticsearch：能够高效的保留数据，并且可能不便和简略的进行查问。

file：将event数据保留到文件中。

graphite：将event数据发送到图形化组件中，一个很风行的开源存储图形化展现的组件。

Codecs：codecs 是基于数据流的过滤器，它能够作为input，output的一部分配置。
Codecs能够帮忙你轻松的宰割发送过去曾经被序列化的数据。
常见的codecs：

json：应用json格局对数据进行编码/解码。

multiline：将多个事件中数据汇总为一个繁多的行。比方：java异样信息和堆栈信息。

3.4 Logstash装置配置

在192.168.116.141机器节点上进行装置：

下载解压

下载：

cd /usr/local
wget https://artifacts.elastic.co/downloads/logstash/logstash-7.10.2-linux-x86_64.tar.gz

解压：

tar -xvf logstash-7.10.2-linux-x86_64.tar.gz

创立数据存储与日志记录目录

[root@localhost logstash-7.10.2]# mkdir -p /usr/local/logstash-7.10.2/data
[root@localhost logstash-7.10.2]# mkdir -p /usr/local/logstash-7.10.2/logs

批改配置文件：

vi /usr/local/logstash-7.10.2/config/logstash.yml

配置内容：

# 数据存储门路
path.data: /usr/local/logstash-7.10.2/data
# 监听主机地址
http.host: "192.168.116.141"
# 日志存储门路
path.logs: /usr/local/logstash-7.10.2/logs
#启动监控插件
xpack.monitoring.enabled: true 
#Elastic集群地址
xpack.monitoring.elasticsearch.hosts:["http://192.168.116.140:9200","http://192.168.116.140:9201","http://192.168.116.140:9202"]

创立监听配置文件：

vi /usr/local/logstash-7.10.2/config/logstash.conf

配置：

input {
  beats {
    # 监听端口
    port => 5044
  }
}

output {

  stdout {
    # 输入编码插件
    codec => rubydebug
  }

  elasticsearch {
    # 集群地址
    hosts => ["http://192.168.116.140:9200","http://192.168.116.140:9201","http://192.168.116.140:9202"]

  }
}

启动服务：

以root用户身份执行：

## 后盾启动形式
nohup  /usr/local/logstash-7.10.2/bin/logstash -f /usr/local/logstash-7.10.2/config/logstash.conf &
##
./logstash -f ../config/logstash.conf

胜利启动后会显示以下日志：

[2020-10-15T06:57:40,640][INFO ][logstash.agent           ] Successfully started Logstash API endpoint {:port=>9600}

拜访地址： http://192.168.116.141:9600/, 能够看到返回信息：

3.5 Filebeat装置配置

在192.168.116.141机器节点上操作：

下载解压

与ElasticSearch版本统一，下载7.10.2版本。

cd /usr/local
wget https://artifacts.elastic.co/downloads/beats/filebeat/filebeat-7.10.2-linux-x86_64.tar.gz

解压：

tar -xvf filebeat-7.10.2-linux-x86_64.tar.gz

批改配置文件

vi /usr/local/filebeat-7.10.2/filebeat.yml

批改内容：

# 须要收集发送的日志文件
filebeat.inputs:
- type: log
  enabled: true
  paths:
    - /var/log/messages
# 如果须要增加多个日志，只须要增加
- type: log
  enabled: true
  paths:
    - /var/log/test.log    
# filebeat 配置模块， 能够加载多个配置
filebeat.config.modules:  
  path: ${path.config}/modules.d/*.yml  
  reload.enabled: false    
# 索引分片数量设置
setup.template.settings:
  index.number_of_shards: 2
# kibana 信息配置
setup.kibana:
  host: "192.168.116.140:5601"
# logstash 信息配置 （留神只能开启一项output设置， 如果采纳logstash, 将output.elasticsearch敞开）
output.logstash:  
  hosts: ["192.168.116.141:5044"]
# 附加metadata元数据信息
processors:
  - add_host_metadata: ~
  - add_cloud_metadata: ~

启动服务

## 后盾启动
nohup /usr/local/filebeat-7.10.2/filebeat -e -c /usr/local/filebeat-7.10.2/filebeat.yml &
## 
./filebeat -e -c filebeat.yml

启动胜利后显示日志：

2020-12-15T07:09:33.922-0400    WARN    beater/filebeat.go:367  Filebeat is unable to load the Ingest Node pipelines for the configured modules because the Elasticsearch output is not configured/enabled. If you have already loaded the Ingest Node pipelines or are using Logstash pipelines, you can ignore this warning.
2020-12-15T07:09:33.922-0400    INFO    crawler/crawler.go:72   Loading Inputs: 1
2020-12-15T07:09:33.923-0400    INFO    log/input.go:148        Configured paths: [/var/log/messages]
2020-12-15T07:09:33.923-0400    INFO    input/input.go:114      Starting input of type: log; ID: 14056778875720462600 
2020-12-15T07:09:33.924-0400    INFO    crawler/crawler.go:106  Loading and starting Inputs completed. Enabled inputs: 1
2020-12-15T07:09:33.924-0400    INFO    cfgfile/reload.go:150   Config reloader started

咱们监听的是/var/log/messages系统日志信息，当日志发生变化后， filebeat会通过logstash上报到Elasticsearch中。咱们能够查看下集群的全副索引信息：

http://192.168.116.140:9200/_…

能够看到，曾经生成了名为logstash-2021.07.20-000001索引。

3.6 Kibana配置与查看数据

进入Kibana后盾，进行配置：

http://192.168.116.140:5601

进入【Management】–> 在Index Pattern中输出”logstash-*” –> 点击【next step】, 抉择”@timestamp”,

点击【 Create index pattern 】进行创立。
查看数据

进入【Discover】, 能够查看到收集的数据：

如果没有显示，能够从新调整Time Range工夫范畴。

本文由传智教育博学谷 – 狂野架构师教研团队公布，转载请注明出处！

如果本文对您有帮忙，欢送关注和点赞；如果您有任何倡议也可留言评论或私信，您的反对是我保持创作的能源

关于java:Elasticsearch-Logstash-Kibana搭建ELK日志分析平台官方推荐的BEATS架构

ELK部署利用与工作机制

3.1 ELK日志剖析平台介绍

3.2 ELK部署架构模式

3.2.1 简略架构

3.2.2 音讯队列架构

3.2.3 BEATS架构

3.3 ELK工作机制

3.3.1 Filebeat工作机制

3.3.2 Logstash工作机制

3.4 Logstash装置配置

3.5 Filebeat装置配置

3.6 Kibana配置与查看数据

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于java:Elasticsearch-Logstash-Kibana搭建ELK日志分析平台官方推荐的BEATS架构

ELK部署利用与工作机制

3.1 ELK日志剖析平台介绍

3.2 ELK部署架构模式

3.2.1 简略架构

3.2.2 音讯队列架构

3.2.3 BEATS架构

3.3 ELK工作机制

3.3.1 Filebeat工作机制

3.3.2 Logstash工作机制

3.4 Logstash装置配置

3.5 Filebeat装置配置

3.6 Kibana配置与查看数据

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复