ELK 构建 MySQL 慢日志收集平台

ELK 构建 MySQL 慢日志收集平台,第1张

本文讲解如何通过一套开源日志存储和检索系统 ELK 构建 MySQL 慢日志收集及分析平台。

ELK、EFK 简介

想必你对 ELK、EFK 都不陌生,它们有一个共同的组件:Elasticsearch(简称ES),它是一个实时的全文搜索和分析引擎,可以提供日志数据的收集、分析、存储 3 大功能。另外一个组件 Kibana 是这套检索系统中的 Web 图形化界面系统,可视化展示在 Elasticsearch 的日志数据和结果。

ELF/EFK 工具集中还有 l 和 F 这两个名称的缩写,这两个缩写代表的工具根据不同的架构和使用方式而定。

L 通常是 Logstash 组件,它是一个用来搜集、分析、过滤日志的工具 。

F 代表 Beats 工具(它是一个轻量级的日志采集器),Beats 家族有 6 个成员,Filebeat 工具,它是一个用于在客户端收集日志的轻量级管理工具。

F 也可以代表工具 fluentd,它是这套架构里面常用的日志收集、处理转发的工具。

那么它们(Logstash VS Beats VS fluentd)有什么样的区别呢?Beats 里面是一个工具集,其中包含了 Filebeat 这样一个针对性的日志收集工具。Logstash 除了做日志的收集以外,还可以提供分析和过滤功能,所以它的功能会更加的强大。

Beats 和 fluentd 有一个共同的特点,就是轻量级,没有 Logstash 功能全面。但如果比较注重日志收集性能,Beats 里面的 Filebeat 和 fluentd 这两个工具会更有优势。

Kafka 是 ELK 和 EFK 里面一个附加的关键组件(缩写 K),它主要是在支持高并发的日志收集系统里面提供分布式的消息队列服务。

ELK 的优势

在此之前,先介绍 ELK 日志分析会有一些什么样的优势?主要有 3 点:

1、它是一套开源、完整的日志检索分析系统,包含收集、存储、分析、检索工具。我们不需要去开发一些额外的组件去完成这套功能,因为它默认的开源方式就提供了一整套组件,只要组合起来,就可以完成从日志收集、检索、存储、到整个展示的完整解决方案了。

2、支持可视化的数据浏览。运维人员只要在控制台里选择想关注的某一段时间内的数据,就可以查看相应的报表,非常快捷和方便。

3、它能广泛的支持一些架构平台,比如我们现在讲到的 K8s 或者是云原生的微服务架构。

Kafka 作为日志消息队列,客户端通过 Filebeat 收集数据(日志)后将其先存入 Kafka,然后由 Logstash 提取并消费,这套架构的好处是:当我们有海量日志同步情况下,直接存入服务端 ES 很难直接应承接海量流量,所以 Kafka 会进行临时性的存取和缓冲,再由 Logstash 进行提取、过滤,通过 Logstash 以后,再把满足条件的日志数据存入 ES。

ES 不再是以单实例的方部署,而是采用集群架构,考虑 Kafka 的集群模式, Logstash 也使用集群模式。

我们会看到这套架构稍微庞大,大中型的企业往往存储海量数据(上百 T 或 P 级)运维日志、或者是系统日志、业务日志。

完成ELK服务搭建后,首先我需要开启的是 MySQL 的慢查询配置,那么通过 set global slow_query_log=‘ON‘,这样就可以开启慢查询日志,还需要设置好慢查询日志标准是大于 1 秒的,那么同样是 set global long_query_time 大于或等于 1,它的意思是大于 1 秒的查询语句,才会认为是慢查询,并且做日志的记录。

那么另外还要设置慢查询日志的位置,通过 set global slow_query_log = 日志文件路径,这里设置到 filebeat 配置监听的路径下,就完成了慢查询日志的路径设置。

配置完成以后,需要在 MySQL 终端上,模拟执行一条执行时间较长的语句,比如执行 select sleep(5),这样就会模拟执行一条查询语句,并且会让它休眠 5 秒。接下来我们看到服务端窗口的 MySQL 这条 sleep 语句已经执行完毕了,同时我们可以再打开 filebeat 的推送窗口,发现这里产生了一条推送日志,表示成功地把这条日志推送给了 ES。

那么接下来我们就可以通过浏览器打开 Kibana 的管理后台,从界面里来看一看检索日志的记录和一些可视化展示的图表,我们可以点击界面上的 Discover 按钮,同时选择好对应的时间周期,然后可以增加一个 filter 过滤器,过滤器里面敲入对应的关键字来进行索引。

这里我敲入的是 slow.query 这个关键字,就会匹配出对应的可以检索的项目,点击想要查询的对应项目,展示出想检索的某一个时间周期内对应的一些日志记录,以及它的图表是什么样子的,同时在下方会有对应的 MySQL 的日志信息打印出来,通过 Kibana 这样的可视化界面就能够看到的相关信息了。

创建kibana索引

若只需要收集显示nginx的访问日志,则可以建立一个名为nginx+时间的索引 

若是需要收集一个服务器下的多个服务日志,则可以在一个conf下添加多个input并根据type来区分和实现

环境 

192.168.2.112 ES/kibana 

192.168.2.118 logstash/nginx 

192.168.2.117 logstash/mysql/nginx

建立nginx索引

1)在118服的logstash/etc目录下建立的nginxlog.conf,添加

input {

   file {

       path =>"/usr/local/nginx/logs/access.log"

       type =>"nginx"

   }

}

output {

   elasticsearch {

       hosts =>"192.168.2.112:9200"

       index =>"nginx-%{+YYYY.MM.dd}"

       }

}12345678910111213

其中,index即代表对应的索引名称

2)然后启动logstash

[root@localhost etc]# pwd/usr/local/logstash/etc

[root@localhost etc]# ../bin/logstash  -f nginxlog.conf1234

3)登陆kibana设置索引

4)然后手动访问nginx页面后,可以在kibana的discover界面看到

收集nginx日志和mysql日志

1)把118服的logstash目录复制到117服对应目录下

scp -r logstash/*  root@192.168.2.117:/usr/local/logstash1

2)在117服logstash/etc目录下建立all.conf

input {

   file {

       path =>"/usr/local/nginx/logs/access.log"

       type =>"nginx"

   }

}

input {

   file {

       path =>"/var/log/mysqld.log"

       type =>"mysql"

   }

}

output {  if [type] == "nginx"{

   elasticsearch {

       hosts =>"192.168.2.112:9200"

       index =>"nginx-%{+YYYY.MM.dd}"

       }

}if [type] == "mysql"{

   elasticsearch {

       hosts =>"192.168.2.112:9200"

       index =>"mysql-%{+YYYY.MM.dd}"

       }

}

}1234567891011121314151617181920212223242526272829

3)在kibana页面建立mysql索引

4)启动logstash

[root@host107 etc]# pwd/usr/local/logstash/etc

[root@host107 etc]# ../bin/logstash -f all.conf1234

5)然后启动及关闭mysql服务,就可以看到日志数据

6)同样的,访问nginx页面后,也会收到nginx日志数据

备注: 

1)其中上面的host列显示0.0.0.0,是因为没有设置主机名,在/etc/hosts下加上 

127.0.0.1 hostmysqlnginx 

然后hostname hostmysqlnginx 

重启下logstash,就可以看到host

E: elastcisearch 数据搜索 数据存储 java

L: Logstash 数据收集 ( 数据解析

数据转换 ) 数据输出 java

F: Filebeat 数据采集 (简单的数据处理 ) <--go K:

Kibana 数据分析 数据展示

容器:docker

代理:nginx、Haproxy

web:nginx、Tomcat、Httpd、PHP

db:mysql、redis、mongo、elasticsearch

存储:nfs、glusternfs、fastdfs

系统:message、security

业务:app

cerebro插件来检查整个集群的环境。默认监听9000端口

master角色:负责控制整个集群的 *** 作,通过cluster_status状态维护集群

选举:cluster.initial_master_nodes master-eligible

可以不参与选举: node.master: false

cluster_state:节点信息 索引信息

data角色:存储数据(默认都是data节点)关闭data: node.data: false

coordinating角色:负责路由 不能取消

Cluster Health三种状态:

1.green 健康状态,指所有的分片和副本都正常分配

2.yellow 指左右的主分片都正常分配,但是副本没正常分配

shard = hash(routing) % numbei=r_of_primary_shards

hash 算法保证将数据均匀的分散在集群中

routing 十一个关键参数,默认是文档id

numbei=r_of_primary_shards 主分片数


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/zaji/8300932.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-15
下一篇2023-04-15

发表评论

登录后才能评论

评论列表(0条)

    保存