elesearch 搭建 elasticsearch windows搭建

转载

小题大作 2024-05-11 20:18:44

文章标签 elesearch 搭建 elasticsearch 分词器重启 文章分类 架构后端开发

本文介绍如何在 windows 10 ，64位操作系统上安装最新版本 Elasticsearch、以及相关插件。之前看了不少园友的文章，用到的版本都比较低，尤其是插件的版本要和ES的版本相对应等这些问题，介绍的不是很详细，干脆自己记录一下安装配置过程，也供他人参考。

Elasticsearch简介

Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎，基于RESTful web接口。Elasticsearch是用Java语言开发的，并作为Apache许可条款下的开放源码发布，是一种流行的企业级搜索引擎。

配置 java 环境

由于ES是Java语言开发的，所以这里需要先安装Java环境

下载时，需要先注册Oracle账号，注册后选择下载 Windows x 64 .exe 这个最新版本（目前是 2020年7月，版本是 jdk14 ）

elesearch 搭建 elasticsearch windows搭建_重启

双击 jdk-14_windows-x64-bin ，然后一直点击 “下一步” 按钮，直到安装完毕，默认的安装路径是 C:\Program Files\Java\jdk-14\ 按照默认路径安装即可

接下来，需要配置Java环境变量，右击 “我的电脑” ——点击 “属性” ——点击 “高级系统设置”，如下图

elesearch 搭建 elasticsearch windows搭建_重启_02

在新窗口的 “高级” 选项卡中，点击 “环境变量” ，再点击系统变量（S）里的 “新建” 按钮，弹出新窗口如下图所示

elesearch 搭建 elasticsearch windows搭建_分词器_03

变量名填入： JAVA_HOME 变量值填入安装的路径： C:\Program Files\Java\jdk-14

然后在系统变量（S）中，选中Path 这个变量，点击 “编辑” 按钮，打开编辑窗口，再点击 “新建” 按钮，输入 %JAVA_HOME%\bin 如下图所示

elesearch 搭建 elasticsearch windows搭建_elesearch 搭建_04

最后验证一下配置是否成功，打开 cmd 窗口（以管理员形式打开），输入命令 java -version 或者命令 javac 可以看安装是否成功，如下图

elesearch 搭建 elasticsearch windows搭建_重启_05

以上说明安装成功，java 版本是14

下载并安装 Elasticsearch

ES工具包下载地址是：http://www.elasticsearch.org/download/

我们选择版本 7.8.0 window 这个版本，先在D盘建一个 ES 目录（方便管理），将下载的包解压到 ES 目录中，如下图所示

elesearch 搭建 elasticsearch windows搭建_elesearch 搭建_06

以管理员身份运行，打开cmd窗口，进入ES的bin目录： cd /d D:\ES\elasticsearch-7.8.0\bin

然后运行命令 elasticsearch.bat

elesearch 搭建 elasticsearch windows搭建_重启_07

稍等片刻，然后在浏览器中访问 http://localhost:9200/

elesearch 搭建 elasticsearch windows搭建_elasticsearch_08

以上说明 ES 相关包已经成功安装

安装Head插件

安装 Head 插件的前提，是需要将 node、grunt 安装和配置完善。

1、首先下载 node.js

下载地址是 https://nodejs.org/en/download/

选择window 64位的版本 v12.18.1，一直点击 “下一步” 按钮，直到安装完毕，下载完成可以通过命令 node -v 查看安装版本以及是否成功，如下图

elesearch 搭建 elasticsearch windows搭建_elesearch 搭建_09

2、安装grunt

以管理员身份打开cmd命令窗口，执行 npm install -g grunt-cli 然后通过 grunt -version 看安装的版本

elesearch 搭建 elasticsearch windows搭建_elesearch 搭建_10

3、下载 Head

Head 相关文档 http://mobz.github.io/elasticsearch-head/

或者直接到 https://github.com/mobz/elasticsearch-head 下载 zip 包到本地。请注意，上面ES安装的版本是 v.7.8.0 ，这里 Head 插件也要选择 master 这个版本下载。

下载完，我们将其解压到上面提到的D盘ES目录，跟ES放在同一级目录，方便管理，如下图所示

elesearch 搭建 elasticsearch windows搭建_elesearch 搭建_11

cmd 进入head 目录： cd /d D:\ES\elasticsearch-head-master

然后执行命令：npm install 如下图所示

elesearch 搭建 elasticsearch windows搭建_分词器_12

上图执行过程卡住了，主要是缺少 phantomjs-2.1.1-windows ，按照上边的提示，先下载这个文件，

然后放在目录 C:\Users\ADMINI~1\AppData\Local\Temp\phantomjs\phantomjs-2.1.1-windows.zip

顺便解压一下，再重新试一下执行 npm install ，这次执行成功了，见下图

elesearch 搭建 elasticsearch windows搭建_重启_13

然后执行 npm start ，启动 Head 插件，如下图所示

elesearch 搭建 elasticsearch windows搭建_分词器_14

再访问 http://localhost:9100 可以看到下图效果

elesearch 搭建 elasticsearch windows搭建_elasticsearch_15

虽然Head已经是安装成功，但是目前是未连接状态，上网查一下资料，需要做以下配置：

找到文件 D:\ES\elasticsearch-7.8.0\config\elasticsearch.yml 在该文件最后添加以下语句：

http.cors.enabled: true

http.cors.allow-origin: "*"

然后再重启ES，重启Head：

重启ES cd /d D:\ES\elasticsearch-7.8.0\bin\elasticsearch.bat

重启Head cd /d D:\ES\elasticsearch-head-master\npm start

再访问 http://localhost:9200/ 以及 http://localhost:9100/

这时可以看到，现在连接上了，灰色变成绿色，Head 安装成功。

为什么要这样配置，可以参考文章

elesearch 搭建 elasticsearch windows搭建_重启_16

总结一下，Head 插件安装比较麻烦，但是通过看报错信息以及网上资料文档，多多尝试，是可以解决的。

安装 Kibana

Kibana 插件是一个可视化的插件，非必须，如果需要安装也可以参考以下的流程

下载地址是 https://www.elastic.co/cn/downloads/kibana

注意，我们用的ES版本是 v7.8.0 , Kibana 安装的版本也是要和ES的同步，这里选择 Kibana版本为 7.8.0

同样，下载完毕后，我们将其解压到 D:\ES\kibana-7.8.0

同样以管理员身份打开cmd 窗口执行命令

cd /d D:\ES\kibana-7.8.0\bin

kibana.bat

执行完，能正常打开 http://localhost:5601 即成功，Kibana 要怎么用，以后再来详细说明。

安装分词器 IK

ES默认的分词器，对中文的分解不是很好，所以需要用到其它分词器，这里以IK分词器为例，介绍怎么安装。

首先往ES添加索引，用 postman 提交数据：

put http://localhost:9200/db_news/new/1

注意：这次提交，会自动创建索引库 db_news 并创建文档 type=new id=1，其实在ES7版本中，已经弃用 type 的概念，实际上应该是 put http://localhost:9200/db_news/_doc/1

如果要查看ES创建的索引库 db_news 的结构，可以这样查询 get http://localhost:9200/db_news/_mapping 后面的博客将会继续讲解 mapping，这里不再详细解说

{
    "title":"今日头条新闻",
    "author":"新华时报记者",
    "content":"今日券商股继续涨停"
}

提交后可以看到返回结果

{
    "_index": "db_news",
    "_type": "new",
    "_id": "1",
    "_version": 1,
    "result": "created",
    "_shards": {
        "total": 2,
        "successful": 1,
        "failed": 0
    },
    "_seq_no": 0,
    "_primary_term": 1
}

如果我们用ES原生的分词器，例如

get http://localhost:9200/db_news/_analyze

{
    "analyzer":"standard",
    "text":"我是中国人，我爱自己的祖国"
 }

分词结果是

{
    "tokens": [
        {
            "token": "我",
            "start_offset": 0,
            "end_offset": 1,
            "type": "<IDEOGRAPHIC>",
            "position": 0
        },
        {
            "token": "是",
            "start_offset": 1,
            "end_offset": 2,
            "type": "<IDEOGRAPHIC>",
            "position": 1
        },
        {
            "token": "中",
            "start_offset": 2,
            "end_offset": 3,
            "type": "<IDEOGRAPHIC>",
            "position": 2
        },
        {
            "token": "国",
            "start_offset": 3,
            "end_offset": 4,
            "type": "<IDEOGRAPHIC>",
            "position": 3
        },
        {
            "token": "人",
            "start_offset": 4,
            "end_offset": 5,
            "type": "<IDEOGRAPHIC>",
            "position": 4
        },
        {
            "token": "我",
            "start_offset": 6,
            "end_offset": 7,
            "type": "<IDEOGRAPHIC>",
            "position": 5
        },
        {
            "token": "爱",
            "start_offset": 7,
            "end_offset": 8,
            "type": "<IDEOGRAPHIC>",
            "position": 6
        },
        {
            "token": "自",
            "start_offset": 8,
            "end_offset": 9,
            "type": "<IDEOGRAPHIC>",
            "position": 7
        },
        {
            "token": "己",
            "start_offset": 9,
            "end_offset": 10,
            "type": "<IDEOGRAPHIC>",
            "position": 8
        },
        {
            "token": "的",
            "start_offset": 10,
            "end_offset": 11,
            "type": "<IDEOGRAPHIC>",
            "position": 9
        },
        {
            "token": "祖",
            "start_offset": 11,
            "end_offset": 12,
            "type": "<IDEOGRAPHIC>",
            "position": 10
        },
        {
            "token": "国",
            "start_offset": 12,
            "end_offset": 13,
            "type": "<IDEOGRAPHIC>",
            "position": 11
        }
    ]
}

显然，这样的分词毫无意义，这也是我们要安装IK分词器的原因。

IK分词器下载地址 https://github.com/medcl/elasticsearch-analysis-ik 同样用 7.8.0 版本

在 D:\ES\elasticsearch-7.8.0\plugins 新建 ik 文件夹，将以上下载的包解压到这里，如下图所示

elesearch 搭建 elasticsearch windows搭建_分词器_17

然后重启 ES，再进行IK分词测试

Get http://localhost:9200/db_news/_analyze

{
    "analyzer":"ik_smart",
    "text":"我是中国人，我爱自己的祖国"
}

返回分词结果是

{
    "tokens": [
        {
            "token": "我",
            "start_offset": 0,
            "end_offset": 1,
            "type": "CN_CHAR",
            "position": 0
        },
        {
            "token": "是",
            "start_offset": 1,
            "end_offset": 2,
            "type": "CN_CHAR",
            "position": 1
        },
        {
            "token": "中国人",
            "start_offset": 2,
            "end_offset": 5,
            "type": "CN_WORD",
            "position": 2
        },
        {
            "token": "我",
            "start_offset": 6,
            "end_offset": 7,
            "type": "CN_CHAR",
            "position": 3
        },
        {
            "token": "爱",
            "start_offset": 7,
            "end_offset": 8,
            "type": "CN_CHAR",
            "position": 4
        },
        {
            "token": "自己",
            "start_offset": 8,
            "end_offset": 10,
            "type": "CN_WORD",
            "position": 5
        },
        {
            "token": "的",
            "start_offset": 10,
            "end_offset": 11,
            "type": "CN_CHAR",
            "position": 6
        },
        {
            "token": "祖国",
            "start_offset": 11,
            "end_offset": 13,
            "type": "CN_WORD",
            "position": 7
        }
    ]
}

可以看到，分词后不再是一个汉字分成一组，而是一个名词分成一组，这样方便我们进行关键词匹配和检索，具体用法可以看后续博文，至此，IK分词也安装成功。

本文关于环境搭建的过程，已经写得很详细了，关于ES的应用，可以看后续的更新。