ELK企业级日志分析系统

壹、ELK简介

  • ELK平台是一套完整的日志集中处理解决方案,将ElasticSearchLogstashKiabana 三个开源工具配合使用,完成更强大的用户对日志的查询、排序、统计需求。

ElasticSearch

ElasticSearch是基于Lucene (一个全文检索引擎的架构)开发的分布式存储检索引擎用来存储各类日志

ElasticSearch是用Java开发的,可通过RESTful Web 接口,让用户可以通过浏览器与 ElasticSearch通信。

ElasticSearch是一个实时的、分布式的可扩展的搜索引擎允许进行全文、结构化搜索

ElasticSearch通常用于索引和搜索大容量的日志数据,也可用于搜索许多不同类型的文档。

Kiabana

Kibana通常与ElasticSearch一起部署,Kibana 是 BlasticSearch 的一个功能强大的数据可视化Dashboard,

Kibana提供图形化的 Web 界面来浏览ElasticSearch日志数据,可以用来汇总、分析和搜索重要数据

Logstash

Logstash作为日志数据收集引擎。它支持动态的从各种数据源搜集数据,并对数据进行过滤、分析、丰富、统一格式等操作,然后存储到用户指定的位置,一般会发送给ElasticSearch。

Logstash 由 Ruby 语言编写,运行在Java 虚拟机(JVM)上,是一款强大的数据处理工具,可以实现数据传输、格式处理、格式化输出。Logstash具有强大的插件功能,常用于日志处理

Filebeat

Filebeat轻量级的开源日志文件数据搜集器

Filebeat通常在需要采集数据的客户端安装 Filebeat,并指定目录与日志格式,Filebeat 就能快速收集数据,并发送给 logstash 进行解析,或是直接发给 ElasticSearch 存储

Filebeat性能上相比运行于JVM上的 logstash 优势明显是对它的替代。常应用于EFLK架构当中。

Filebeat结合logstash带来好处:
  1. 通过 Logstash具有基于磁盘的自适应缓冲系统,该系统将吸收传入的吞吐量,从而减轻ElasticSearch持续写入数据的压力
  2. 从其他数据源(例如数据库,S3对象存储或消息传递队列)中提取
  3. 将数据发送到多个目的地,例如S3,HDFS(Hadoop分布式文件系统)或写入文件
  4. 使用条件数据流逻辑组成更复杂的处理管道
  • 缓存/消息队列(redis、kafka、RabbitAQ等):可以对高并发日志数据进行流量削峰和缓冲,这样的缓冲可以一定程度的保护数据不丢失,还可以对整个架构进行应用解耦。

Fluentd

Fluentd是一个流行的开源数据收集器。由于logstash 太重量级的缺点,Logstash 性能低、资源消耗比较多等问题,随后就有Fluentd的出现。

Fluentd相比较logstash,Fluentd更易用、资源消耗更少、性能更高,在数据处理上更高效可靠,受到企业欢迎,成为logstash的一种替代方案,常应用于EFK架构当中。

Fluentd在Kubernetes集群中也常使用EFK作为日志数据收集的方案。

Fluentd在Kubernetes集群中一般是通过DaemonSet来运行的,以便它在每个Kubernetes 工作节点上都可以运行一个Pod。

Fluentd它通过获取容器日志文件、过滤和转换日志数据,然后将数据传递到ElasticSearch集群,在该集群中对其进行索引和存储。


贰、为什么要使用 ELK

日志主要包括系统日志、应用程序日志和安全日志。系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因。经常分析日志可以了解服务器的负荷,性能安全性,从而及时采取措施纠正错误。定期对日志做巡检,根据报错警告来制定对策。

往往单台机器的日志我们使用grep、awk等工具就能基本实现简单分析,但是当日志被分散的储存不同的设备上。如果你管理数十上百台服务器,你还在使用依次登录每台机器的传统方法查阅日志。这样是不是感觉很繁琐和效率低下。当务之急我们使用集中化的日志管理。

例如:开源的syslog,将所有服务器上的日志收集汇总。集中化管理日志后,日志的统计和检索又成为一件比较麻烦的事情,一般我们使用grep、awk和wc等Linux命令能实现检索和统计,但是对于要求更高的查询、排序和统计等要求和庞大的机器数量依然使用这样的方法难免有点力不从心。

一般大型系统是一个分布式部署的架构,不同的服务模块部署在不同的服务器上,问题出现时,大部分情况需要根据问题暴露的关键信息,定位到具体的服务器和服务模块,构建一套集中式日志系统,可以提高定位问题的效率。


叁、完整日志系统基本特征

收集:能够采集多种来源的日志数据 传输:能够稳定的把日志数据解析过滤并传输到存储系统 存储:存储日志数据 分析:支持 UI 分析 警告:能够提供错误报告,监控机制


肆、ELK的工作原理

(1)在所有需要收集日志的服务器上部署Logstash,或者先将日志进行集中化管理在日志服务器上,在日志服务器上部署Logstash。 (2)Logstash收集日志,将日志格式化并输出到ElasticSearch群集中。 (3)ElasticSearch对格式化后的数据进行索引和存储。 (4)Kibana从ES群集中查询数据生成图表,并进行前端数据的展示。

ELK模型.png

总结:logstash作为日志搜集器,从数据源采集数据,并对数据进行过滤,格式化处理,然后交由ElasticSearch存储,kibana对日志进行可视化处理。


伍、ELK日志分析系统的部署

环境配置

主机 操作系统 IP地址 工具/软件包
node1 CentOS7 192.168.80.20 Elasticsearch/Kibana
node2 CentOS7 192.168.80.30 Elasticsearch
apache CentOS7 192.168.80.50 httpd / Logstash

实验准备 关防火墙和系统安全机制

systemctl stop firewalld.service
systemctl disable firewalld.service
setenforce 0

hostnamectl set-hostname 主机名

ELK实验准备.png

1、配置elasticsearch环境

node1(192.168.80.20) node2(192.168.80.30)

echo '192.168.80.20 node1' >> /etc/hosts
echo '192.168.80.30 node2' >> /etc/hosts

java -version    #如果没有安装,yum -y install java

ELKjava环境.png

2、部署elasticsearch软件

node1(192.168.80.20) node2(192.168.80.30) (1)安装elasticsearch—rpm包 上传elasticsearch-5.5.0.rpm到/opt目录下

cd /opt
rpm -ivh elasticsearch-5.5.0.rpm

#加载系统服务
systemctl daemon-reload
systemctl enable elasticsearch.service

ELK加载安装.png

(2)更改elasticsearch主配置文件

cp /etc/elasticsearch/elasticsearch.yml /etc/elasticsearch/elasticsearch.yml.bak

vim /etc/elasticsearch/elasticsearch.yml
#17行;取消注释,修改;集群名字
cluster.name: my-elk-cluster
#23行;取消注释,修改;节点名字(node2修改成node2)
node.name: node1
#33行;取消注释,修改;数据存放路径
path.data: /data/elk_data
#37行;取消注释,修改;日志存放路径
path.logs: /var/log/elasticsearch
#43行;取消注释,修改;不在启动的时候锁定内存
bootstrap.memory_lock: false
#55行;取消注释,修改;提供服务绑定的IP地址,0.0.0.0代表所有地址
network.host: 0.0.0.0
#59行;取消注释;侦听端口为9200(默认)
http.port: 9200
#68行;取消注释,修改;集群发现通过单播实现,指定要发现的节点 node1、node2
discovery.zen.ping.unicast.hosts: ["node1", "node2"]

ELK修改配置文件1.png

ELK修改配置文件2.png

ELK修改配置文件3.png

  • 检验配置
grep -v "^#" /etc/elasticsearch/elasticsearch.yml

(3)创建数据存放路径并授权

mkdir -p /data/elk_data
chown elasticsearch:elasticsearch /data/elk_data/

(4)启动elasticsearch是否成功开启

systemctl start elasticsearch
netstat -antp |grep 9200

ELK创建数据存放目录是否成功.png

(5)查看节点信息

http://192.168.80.20:9200
http://192.168.80.30:9200

ELK查看.png

(6)检验集群健康状态

http://192.168.80.20:9200/_cluster/health?pretty
http://192.168.80.30:9200/_cluster/health?pretty

ELK查看健康状态.png

(7)查看集群状态

http://192.168.80.20:9200/_cluster/state?pretty
http://192.168.80.30:9200/_cluster/state?pretty

ELK查看集群名称.png

3、安装elasticsearch-head插件

  • 安装elasticsearch-head插件,用于管理集群

(1)编译安装node组件依赖包 node1(192.168.80.20) node2(192.168.80.30)

yum -y install gcc gcc-c++ make

上传软件包 node-v8.2.1.tar.gz 到/opt
cd /opt
tar xzvf node-v8.2.1.tar.gz
cd node-v8.2.1/
./configure && make && make install

ELK编译安装.png

(2)安装phantomjs(前端框架) node1(192.168.80.20) node2(192.168.80.30)

上传软件包 phantomjs-2.1.1-linux-x86_64.tar.bz2 到/opt目录下
cd /opt
tar jxvf phantomjs-2.1.1-linux-x86_64.tar.bz2 -C /usr/local/src/
cd /usr/local/src/phantomjs-2.1.1-linux-x86_64/bin
cp phantomjs /usr/local/bin

ELKpha1.png

ELKpha2.png

(3)安装elasticsearch-head(数据可视化工具) node1(192.168.80.20) node2(192.168.80.30)

上传软件包 elasticsearch-head.tar.gz 到/opt
cd /opt
tar zxvf elasticsearch-head.tar.gz -C /usr/local/src/
cd /usr/local/src/elasticsearch-head/
npm install

ELKehead.png

ELKnpm安装.png

(4)修改主配置文件 node1(192.168.80.20) node2(192.168.80.30)

vim /etc/elasticsearch/elasticsearch.yml
......
#---------末尾;添加以下内容
http.cors.enabled: true
http.cors.allow-origin: "*"

#---------参数解释
http.cors.enabled: true				#开启跨域访问支持,默认为 false
http.cors.allow-origin: "*"			#指定跨域访问允许的域名地址为所有


systemctl restart elasticsearch.service

ELK修主配置文件.png

ELK末行添加.png

(5)启动elasticsearch-head

node1(192.168.80.20) node2(192.168.80.30)

必须在解压后的 elasticsearch-head 目录下启动服务,进程会读取该目录下的 gruntfile.js 文件,否则可能启动失败。
cd /usr/local/src/elasticsearch-head/
npm run start &

> elasticsearch-head@0.0.0 start /usr/local/src/elasticsearch-head
> grunt server

Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100

elasticsearch-head 监听的端口是 9100
netstat -natp |grep 9100

ELK9100.png

(6)使用elasticsearch-head插件查看集群状态

http://192.168.80.20:9100
在Elasticsearch 后面的栏目中输入
http://192.168.80.20:9200

http://192.168.80.30:9100
在Elasticsearch 后面的栏目中输入
http://192.168.80.30:9200

ELK输入查看集群状态.png

(7)创建索引 node1(192.168.80.20) 创建索引为index-demo,类型为test

curl -XPUT 'localhost:9200/index-demo/test/1?pretty&pretty' -H 'content-Type: application/json' -d '{"user":"zhangsan","mesg":"hello world"}'

ELKnode1创建信息.png

  • 打开浏览器输入地址,查看索引信息
http://192.168.80.20:9100

ELK索引信息.png

  • 点击数据浏览–会发现在node1上创建的索引为index-demo,类型为test, 相关的信息

ELK查看索引2.png

4、安装logstash

收集日志输出到elasticsearch中

(1)安装Apahce服务(httpd) apache(192.168.80.50)

yum -y install httpd
systemctl start httpd

(2)安装Java环境 apache(192.168.80.50)

java -version        ###如果没有装 安装yum -y install java

ELKapache服务.png (3)安装logstash apache(192.168.80.50)

上传logstash-5.5.1.rpm到/opt目录下
cd /opt
rpm -ivh logstash-5.5.1.rpm

systemctl start logstash.service
systemctl enable logstash.service

#建立logstash软连接
ln -s /usr/share/logstash/bin/logstash /usr/local/bin/

ELKlogins.png

(4)测试logstash命令 apache(192.168.80.50)

字段描述解释:
-f  通过这个选项可以指定logstash的配置文件,根据配置文件配置logstash
-e  后面跟着字符串 该字符串可以被当做logstash的配置(如果是” ”,则默认使用stdin做为输入、stdout作为输出)
-t  测试配置文件是否正确,然后退出

定义输入和输出流:
输入采用标准输入,输出采用标准输出(类似管道)
logstash -e 'input { stdin{} } output { stdout{} }'

ELK测试1.png

  • 使用rubydebug显示详细输出,codec为一种编解码器
logstash -e 'input { stdin{} } output { stdout{ codec=>rubydebug } }'

ELK测试2.png

  • 使用 Logstash 将信息写入 Elasticsearch 中
logstash -e 'input { stdin{} } output { elasticsearch { hosts=>["192.168.80.20:9200"] } }'

ELK测试3.png

  • 查看索引信息
多出logstash-日期
http://192.168.80.20:9100

ELK日期索引.png

  • 点击数据浏览查看响应的内容

ELK添加查看31.png

(5)在Apache主机上做对接配置 apache(192.168.80.50)

  • Logstash配置文件主要由三部分组成:input、output、filter(根据需要)
chmod o+r /var/log/messages
ll /var/log/messages

vim /etc/logstash/conf.d/system.conf
input {
       file{
        path => "/var/log/messages"
        type => "system"
        start_position => "beginning"
        }
      }
output {
        elasticsearch {
          hosts => ["192.168.80.20:9200"]
          index => "system-%{+YYYY.MM.dd}"
          }
        }


systemctl restart logstash.service

ELK重启.png

  • 查看索引信息
多出 system-日期
http://192.168.80.20:9100

ELK系统日志1.png

ELK系统日志2.png

5、安装kibana

node1(192.168.80.20)

上传kibana-5.5.1-x86_64.rpm 到/opt目录
cd /opt
rpm -ivh kibana-5.5.1-x86_64.rpm

cd /etc/kibana/
cp kibana.yml kibana.yml.bak

vim kibana.yml
#2行;取消注释;kibana打开的端口(默认5601)
server.port: 5601
#7行;取消注释,修改;kibana侦听的地址
server.host: "0.0.0.0"
#21行;取消注释,修改;和elasticsearch建立联系
elasticsearch.url: "http://192.168.80.20:9200"
#30行;取消注释;在elasticsearch中添加.kibana索引
kibana.index: ".kibana"              				

systemctl start kibana.service 
systemctl enable kibana.service

ELKkkkkkk.png

ELK数据es.png

ELKkk开机自启.png

  • 在浏览器上访问
192.168.80.20:5601

#首次登录创建一个索引 名字:system-* (这是对接系统日志文件),然后点最下面的出面的create 按钮创建

ELK创建kibana.png

  • 然后点最左上角的Discover按钮 会发现system-*信息

ELKadd点击.png

  • 然后点下面的host旁边的add 会发现右面的图只有 Time 和host 选项了 这个比较友好

ELKtime.png

(6)对接Apache主机的Apache 日志文件(访问日志、错误日志) apache(192.168.80.50)

cd /etc/logstash/conf.d/

vim apache_log.conf
input {
     file{
        path => "/etc/httpd/logs/access_log"
        type => "access"
        start_position => "beginning"
      }
     file{
        path => "/etc/httpd/logs/error_log"
        type => "error"
        start_position => "beginning"
      }
}
output {
    if [type] == "access" {
        elasticsearch {
          hosts => ["192.168.80.20:9200"]
          index => "apache_access-%{+YYYY.MM.dd}"
        }
    }
    if [type] == "error" {
        elasticsearch {
          hosts => ["192.168.80.20:9200"]
          index => "apache_error-%{+YYYY.MM.dd}"
        }
    }
}

/usr/share/logstash/bin/logstash -f apache_log.conf

ELK输入输出.png

ELKsuibian随便.png

在浏览器上打开输入http://192.168.80.50,制造点访问记录

ELK制造访问记录.png

打开浏览器 输入http://192.168.80.20:9100/ 查看索引信息 能发现apache_error-2022.03.01和apache_access-2022.03.01

ELK多出索引信息.png

打开浏览器 输入http://192.168.80.20:5601 点击左下角有个management选项—index patterns—create index pattern 分别创建apache_error-* 和 apache_access-* 的索引

ELKaccess日志.png

ELK查看访问错误日志.png


总结

这套架构还是有不完美的地方,所以还能继续优化、扩充架构,例如扩充为efk架构。 efk架构是由elasticsearch+logstash+filebeat+kafka+kibana+redis构成,其中elasticsearch用于数据的索引和存储;logstash用于格式转换;filebeat(轻量级的文件收集工具)用于日志收集;kafka(消息队列,每秒可以处理几十万的并发数据)+redis(缓存服务)用于抗高并发;kibana用于前端数据的展示。