es集群健康值未连接 es集群健康值红色_日志文件

由于我遇到问题时候没有保存截图,所以我就在网上找了一个同样问题的图片。我们先分析一下颜色值的具体指什么情况

elasticsearch head插件会以不同的颜色显示。 1)、绿色——最健康的状态,代表所有的主分片和副本分片都可用; 2)、黄色——所有的主分片可用,但是部分副本分片不可用,此时也应当即使进行跟进处理; 3)、红色——部分主分片不可用。(此时执行查询部分数据仍然可以查到,遇到这种情况,一般都是由于机器故障导致的,已经道道了error级别,应该及时进行处理。。)

最准确的内容可以参考官网:官方文档

下边简单说一下我排查问题的思路,首先我们已经很清楚elasticsearch的安装路径,和其他应用一样,它的目录架构也是有bin、config、logs构成,那么我们就可以像排查自己代码问题一样进行排查应用所存在的问题,我们就可以发现在logs目录下存在如下几个日志文件。

es集群健康值未连接 es集群健康值红色_es集群健康值未连接_02

根据经验判断xxx-es.log肯定是存放启动日志(类比tomcat的catalina.out),由于我们没有执行任何增删改查索引的操作,所以判断应该不是操作导致的问题,所以就可以去看该文件的信息,判断是否有没有异常,我们先看最近五百条日志吧,tail -500 xxx-es.log。下边是我这边看到的结果。

es集群健康值未连接 es集群健康值红色_es集群健康值未连接_03

看到如下内容我相信,大部分同学都会解决问题了吧,很显然是权限不足导致的,由于elasticsearch的启动必须是非root用户,但是普通用户呢刚开始多少会存在一定的权限问题,这里我简单说几个目录吧,一个是日志存放目录,第二个是数据存放目录。当然这里也可能不是去权限导致的问题,包括远程主机之间无法相互访问等等…

这里我只是给大家一个解决问题的方案和思路-看日志,安装和使用一个应用软件,首先应该定位到它的日志文件存放什么位置,其次就是各个日志文件具体存放的哪些级别(内容)的日志信息。只有这样我们才可以尽可能做到一步到位找到问题的根源从而针对性处理,而不是盲目猜测。