java中的es在yml配置 java中es是什么

转载

mob6454cc6ccc8a 2023-10-11 11:28:01

文章标签 java中的es在yml配置 elasticsearch Elastic 数据 文章分类 Java 后端开发

云栖君导读：Elasticsearch （ES）是一个基于 Lucene 的开源搜索引擎，它不但稳定、可靠、快速，而且也具有良好的水平扩展能力，是专门为分布式环境设计的。

特性

安装方便：没有其他依赖，下载后安装非常方便；只用修改几个参数就可以搭建起来一个集群
JSON：输入/输出格式为 JSON，意味着不需要定义 Schema，快捷方便
RESTful：基本所有操作（索引、查询、甚至是配置）都可以通过 HTTP 接口进行
分布式：节点对外表现对等（每个节点都可以用来做入口）；加入节点自动均衡
多租户：可根据不同的用途分索引；可以同时操作多个索引

集群

其中一个节点就是一个 ES 进程，多个节点组成一个集群。一般每个节点都运行在不同的操作系统上，配置好集群相关参数后 ES 会自动组成集群（节点发现方式也可以配置）。集群内部通过 ES 的选主算法选出主节点，而集群外部则是可以通过任何节点进行操作，无主从节点之分（对外表现对等/去中心化，有利于客户端编程，例如故障重连）。

分片

ES 是一个分布式系统，我们一开始就应该以集群的方式来使用它。它保存索引时会选择适合的“主分片”（Primary Shard），把索引保存到其中（我们可以把分片理解为一块物理存储区域）。分片的分法是固定的，而且是安装时候就必须要决定好的（默认是 5），后面就不能改变了。

既然有主分片，那肯定是有“从”分片的，在 ES 里称之为“副本分片”（Replica Shard）。副本分片主要有两个作用：

高可用：某分片节点挂了的话可走其他副本分片节点，节点恢复后上面的分片数据可通过其他节点恢复
负载均衡：ES 会自动根据负载情况控制搜索路由，副本分片可以将负载均摊

索引

java中的es在yml配置 java中es是什么_java中的es在yml配置

RESTful

这个特性非常方便，最关键的是 ES 的 HTTP 接口不只是可以进行业务操作（索引/搜索），还可以进行配置，甚至是关闭 ES 集群。下面我们介绍几个很常用的接口：

• /_cat/nodes?v：查集群状态
• /_cat/shards?v：查看分片状态
• /index/index/{type}/_search?pretty：搜索

v 是 verbose 的意思，这样可以更可读（有表头，有对齐），_cat 是监测相关的 APIs，/_cat?help 来获取所有接口。index和index和{type} 分别是具体的某一索引某一类型，是分层次的。我们也可以直接在所有索引所有类型上进行搜索：/_search。

日志处理

前面介绍了那么多Elasticsearch简介和特性，大多源自官方介绍和百度，其实写这篇文章的目的就是如何基于Elasticsearch构建网站日志处理系统，通过数据同步工具等一些列开源组件来快速构建一个日志处理系统，后面附项目Demo雏形，并不完善，初步成型中。

开发环境

JDK1.7、Maven、Eclipse、SpringBoot1.5.9、elasticsearch2.4.6、Dubbox2.8.4、zookeeper3.4.6、Vue、Iview

版本介绍

spring-boot-starter-parent-1.5.9.RELEASE、spring-data-elasticsearch-2.1.9.RELEAS、elasticsearch-2.4.6(5.0+以上需要依赖JDK8)

截止2018年1月22日，ElasticSearch目前最新的已到6.1.2，但是spring-boot的更新速度远远跟不上ElasticSearch更新的速度，目前spring-boot支持的最新版本是elasticsearch-2.4.6。

服务说明

使用本地ElasticSearch服务(application-dev.properties)

java中的es在yml配置 java中es是什么_elasticsearch_02

使用远程ElasticSearch服务(application-dev.properties)

需要自行安装ElasticSearch，注意ElasticSearch版本尽量要与JAR包一致。

下载地址：https://www.elastic.co/downloads/past-releases/elasticsearch-2-4-6

安装说明：http://www.52itstyle.com/thread-20114-1-1.html

新版本不建议使用root用户启动，需要自建ElasticSearch用户，也可以使用以下命令启动 elasticsearch -Des.insecure.allow.root=true -d 或者在elasticsearch中加入ES_JAVA_OPTS="-Des.insecure.allow.root=true"。

项目结构

java中的es在yml配置 java中es是什么_Elastic_03

项目演示

项目截图

java中的es在yml配置 java中es是什么_Elastic_04

分页查询

使用ElasticsearchTemplate模板插入了20万条数据，本地向外网服务器(1核1G)，用时60s+，一分钟左右的时间。虽然索引库容量有增加，但是等了大约 10分钟左右的时间才能搜索出来。

分页查询到10000+的时候系统报错，Result window is too large，修改config下的elasticsearch.yml 追加以下代码即可：

java中的es在yml配置 java中es是什么_Elastic_05

参考：https://www.elastic.co/guide/en/elasticsearch/reference/current/index-modules.html

Java API

Elasticsearch为Java用户提供了两种内置客户端：

节点客户端(node client)：
节点客户端，顾名思义，其本身也是Elasticsearch集群的一个组成部分。以无数据节点(none data node)身份加入集群，换言之，它自己不存储任何数据，但是它知道数据在集群中的具体位置，并且能够直接转发请求到对应的节点上。
传输客户端(Transport client)：
这个更轻量的传输客户端能够发送请求到远程集群。它自己不加入集群，只是简单转发请求给集群中的节点。两个Java客户端都通过9300端口与集群交互，使用Elasticsearch传输协议(Elasticsearch Transport Protocol)。集群中的节点之间也通过9300端口进行通信。如果此端口未开放，你的节点将不能组成集群。

安装Elasticsearch-Head

elasticsearch-head是一个界面化的集群操作和管理工具，可以对集群进行傻瓜式操作。你可以通过插件把它集成到es（首选方式）,也可以安装成一个独立webapp。

es-head主要有三个方面的操作：

显示集群的拓扑,并且能够执行索引和节点级别操作
搜索接口能够查询集群中原始json或表格格式的检索数据
能够快速访问并显示集群的状态

插件安装方式、参考：https://github.com/mobz/elasticsearch-head

for Elasticsearch 5.x: site plugins are not supported. Run as a standalone server
for Elasticsearch 2.x: sudo elasticsearch/bin/plugin install mobz/elasticsearch-head
for Elasticsearch 1.x: sudo elasticsearch/bin/plugin -install mobz/elasticsearch-head/1.x
for Elasticsearch 0.x: sudo elasticsearch/bin/plugin -install mobz/elasticsearch-head/0.9

安装成功以后会在plugins目录下出现一个head目录，表明安装已经成功。

浏览截图：

java中的es在yml配置 java中es是什么_java中的es在yml配置_06

x-pack监控

Elasticsearch、Logstash 随着 Kibana 的命名升级直接从2.4跳跃到了5.0，5.x版本的 ELK 在版本对应上要求相对较高，不再支持5.x和2.x的混搭，同时 Elastic 做了一个 package ，对原本的 marvel、watch、alert 做了一个封装，形成了 x-pack 。

安装：https://www.elastic.co/guide/en/elasticsearch/reference/6.1/installing-xpack-es.html

用户管理
x-pack安装之后有一个超级用户elastic ，其默认的密码是changeme，拥有对所有索引和数据的控制权，可以使用该用户创建和修改其他用户，当然这里可以通过kibana的web界面进行用户和用户组的管理。

修改elastic用户的密码：

java中的es在yml配置 java中es是什么_java中的es在yml配置_07

IK Analysis for Elasticsearch

下载安装：
• 方式一 - download pre-build package from here: https://github.com/medcl/elasticsearch-analysis-ik/releasesunzip plugin to folder your-es-root/plugins/
• 方式二 - use elasticsearch-plugin to install ( version > v5.5.1 ): ./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.0.0/elasticsearch-analysis-ik-6.0.0.zip

由于Elasticsearch版本是2.4.6，这里选择IK版本为1.10.6

wget https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v1.10.6/elasticsearch-analysis-ik-1.10.6.zip

下载解压以后在 Elasticsearch 的config下的elasticsearch.yml文件中，添加如下代码(2.0以上可以不设置)。

java中的es在yml配置 java中es是什么_Elastic_08

或者

java中的es在yml配置 java中es是什么_java中的es在yml配置_09

安装前：

java中的es在yml配置 java中es是什么_数据_10

安装后：

java中的es在yml配置 java中es是什么_java中的es在yml配置_11

数据同步

使用第三方工具类库elasticsearch-jdbc实现MySql到elasticsearch的同步。

java中的es在yml配置 java中es是什么_数据_12

运行环境：
centos7.5、JDK8、elasticsearch-jdbc-2.3.2.0

安装步骤：

这里是列表文本第一步：下载(可能很卡、请耐心等待) wget http://xbib.org/repository/org/xbib/elasticsearch/importer/elasticsearch-jdbc/2.3.2.0/elasticsearch-jdbc-2.3.2.0-dist.zip

这里是列表文本第二步：解压 unzip elasticsearch-jdbc-2.3.2.0-dist.zip

这里是列表文本第三步：配置脚本mysql_import_es.sh

java中的es在yml配置 java中es是什么_elasticsearch_13

这里是列表文本第四部：授权并执行

java中的es在yml配置 java中es是什么_Elastic_14

Repository和Template

Spring-data-elasticsearch是Spring提供的操作ElasticSearch的数据层，封装了大量的基础操作，通过它可以很方便的操作ElasticSearch的数据。

ElasticSearchRepository的基本使用

java中的es在yml配置 java中es是什么_elasticsearch_15

ElasticsearchRepository里面有几个特殊的search方法，这些是ES特有的，和普通的JPA区别的地方，用来构建一些ES查询的。主要是看QueryBuilder和SearchQuery两个参数，要完成一些特殊查询就主要看构建这两个参数。

java中的es在yml配置 java中es是什么_java中的es在yml配置_16

一般情况下，我们不是直接是new NativeSearchQuery，而是使用NativeSearchQueryBuilder。通过NativeSearchQueryBuilder.withQuery(QueryBuilder1).withFilter(QueryBuilder2).withSort(SortBuilder1).withXXXX().build();这样的方式来完成NativeSearchQuery的构建。

java中的es在yml配置 java中es是什么_java中的es在yml配置_17