kibana 清空某个索引

转载

lanhy 2024-09-05 08:31:57

文章标签 kibana 清空某个索引 elasticsearch 字段搜索数据 文章分类 数据仓库大数据

.基本概念

Elasticsearch也是基于Lucene的全文检索库，本质也是存储数据，很多概念与MySQL类似的。

对比关系：
索引（indices）--------------------------------Databases 数据库

类型（type）-----------------------------Table 数据表

文档（Document）----------------Row 行

   字段（Field）-------------------Columns 列

概念说明：

索引库（indices)indices是index的复数，代表许多的索引

类型（type）类型是模拟mysql中的table概念，一个索引库下可以有不同类型的索引，比如商品索引，订单索引，其数据格式不同。不过这会导致索引库混乱，因此未来版本中会移除这个概念

文档（document）存入索引库原始的数据。比如每一条商品信息，就是一个文档

字段（field）文档中的属性

映射配置（mappings）字段的数据类型、属性、是否索引、是否存储等特性

使用kibana创建一个索引库：

kibana 清空某个索引_字段

查看索引：

kibana 清空某个索引_字段_02

删除索引：

kibana 清空某个索引_搜索_03

映射配置

索引有了，接下来肯定是添加数据。但是，在添加数据之前必须定义映射。

什么是映射？

映射是定义文档的过程，文档包含哪些字段，这些字段是否保存，是否索引，是否分词等

只有配置清楚，Elasticsearch才会帮我们进行索引库的创建（不一定）

创建映射字段

kibana 清空某个索引_搜索_04

查看映射关系：

kibana 清空某个索引_elasticsearch_05

字段属性详解:type

kibana 清空某个索引_数据_06

几个关键的：

String类型，又分两种：

text：可分词，不可参与聚合
keyword：不可分词，数据会作为完整字段进行匹配，可以参与聚合

Numerical：数值类型，分两类

基本数据类型：long、interger、short、byte、double、float、half_float
浮点数的高精度类型：scaled_float

需要指定一个精度因子，比如10或100。elasticsearch会把真实值乘以这个因子后存储，取出时再还原。

Date：日期类型
elasticsearch可以对日期格式化为字符串存储，但是建议我们存储为毫秒值，存储为long，节省空间。

index

index影响字段的索引情况。

true：字段会被索引，则可以用来进行搜索。默认值就是true
false：字段不会被索引，不能用来搜索

index的默认值就是true，也就是说你不进行任何配置，所有字段都会被索引。

但是有些字段是我们不希望被索引的，比如商品的图片信息，就需要手动设置index为false。

store

是否将数据进行额外存储。

在学习lucene和solr时，我们知道如果一个字段的store设置为false，那么在文档列表中就不会有这个字段的值，用户的搜索结果中不会显示出来。

但是在Elasticsearch中，即便store设置为false，也可以搜索到结果。

原因是Elasticsearch在创建文档索引时，会将文档中的原始数据备份，保存到一个叫做_source的属性中。而且我们可以通过过滤_source来选择哪些要显示，哪些不显示。

而如果设置store为true，就会在_source以外额外存储一份数据，多余，因此一般我们都会将store设置为false，事实上，store的默认值就是false。

新增数据

语法：

POST /索引库名/类型名
{
    "key":"value"
}

kibana 清空某个索引_elasticsearch_07

通过kibana查看数据：

kibana 清空某个索引_数据_08

ource：源文档信息，所有的数据都在里面。
_id：这条文档的唯一标示，与文档自己的id字段没有关联

如果我们想要自己新增的时候指定id，可以这么做:

kibana 清空某个索引_数据_09

智能判断

在学习Solr时我们发现，我们在新增数据时，只能使用提前配置好映射属性的字段，否则就会报错。

不过在Elasticsearch中并没有这样的规定。

事实上Elasticsearch非常智能，你不需要给索引库设置任何mapping映射，它也可以根据你输入的数据来判断类型，动态添加数据映射。

测试一下：

kibana 清空某个索引_elasticsearch_10

修改数据

把刚才新增的请求方式改为PUT，就是修改了。不过修改必须指定id，

id对应文档存在，则修改
id对应文档不存在，则新增

比如，我们把id为3的数据进行修改：

kibana 清空某个索引_elasticsearch_11

删除数据

删除使用DELETE请求，同样，需要根据id进行删除：
语法：

DELETE /索引库名/类型名/id值

kibana 清空某个索引_elasticsearch_12

查询

我们从4块来讲查询：

基本查询
_source过滤
结果过滤
高级查询
排序

基本查询：

基本语法

GET /索引库名/_search
{
    "query":{
        "查询类型":{
            "查询条件":"查询条件值"
        }
    }
}

这里的query代表一个查询对象，里面可以有不同的查询属性

查询类型：

例如：match_all， match，term ， range 等等

查询条件：查询条件会根据类型的不同，写法也有差异，后面详细讲解

查询所有（match_all)：

kibana 清空某个索引_字段_13

query：代表查询对象
match_all：代表查询所有
took：查询花费时间，单位是毫秒
time_out：是否超时
_shards：分片信息
hits：搜索结果总览对象

total：搜索到的总条数
max_score：所有结果中文档得分的最高分
hits：搜索结果的文档对象数组，每个元素是一条搜索到的文档信息

_index：索引库
_type：文档类型
_id：文档id
_score：文档得分
_source：文档的源数据

匹配查询（match）

我们先加入一条数据，便于测试：

PUT /heima/goods/3
{
    "title":"小米电视4A",
    "images":"http://image.leyou.com/12479122.jpg",
    "price":3899.00
}

or关系

match类型查询，会把查询条件进行分词，然后进行查询,多个词条之间是or的关系

kibana 清空某个索引_kibana 清空某个索引_14

在上面的案例中，不仅会查询到电视，而且与小米相关的都会查询到，多个词之间是or的关系。

and关系

某些情况下，我们需要更精确查找，我们希望这个关系变成and，可以这样做：

kibana 清空某个索引_字段_15

or和and之间？

在 or 与 and 间二选一有点过于非黑即白。如果用户给定的条件分词后有 5 个查询词项，想查找只包含其中 4 个词的文档，该如何处理？将 operator 操作符参数设置成 and 只会将此文档排除。

有时候这正是我们期望的，但在全文搜索的大多数应用场景下，我们既想包含那些可能相关的文档，同时又排除那些不太相关的。换句话说，我们想要处于中间某种结果。

match 查询支持 minimum_should_match 最小匹配参数，这让我们可以指定必须匹配的词项数用来表示一个文档是否相关。我们可以将其设置为某个具体数字，更常用的做法是将其设置为一个百分数，因为我们无法控制用户搜索时输入的单词数量：

kibana 清空某个索引_字段_16

本例中，搜索语句可以分为3个词，如果使用and关系，需要同时满足3个词才会被搜索到。这里我们采用最小品牌数：75%，那么也就是说只要匹配到总词条数量的75%即可，这里3*75% 约等于2。所以只要包含2个词条就算满足条件了。

多字段查询（multi_match）

multi_match与match类似，不同的是它可以在多个字段中查询

kibana 清空某个索引_数据_17

词条匹配(term)

term 查询被用于精确值匹配，这些精确值可能是数字、时间、布尔或者那些未分词的字符串

kibana 清空某个索引_kibana 清空某个索引_18

多词条精确匹配(terms)

terms 查询和 term 查询一样，但它允许你指定多值进行匹配。如果这个字段包含了指定值中的任何一个值，那么这个文档满足条件：

kibana 清空某个索引_搜索_19

结果过滤

默认情况下，elasticsearch在搜索的结果中，会把文档中保存在_source的所有字段都返回。

如果我们只想获取其中的部分字段，我们可以添加_source的过滤

直接指定字段

示例：

kibana 清空某个索引_搜索_20

指定includes和excludes

我们也可以通过：

includes：来指定想要显示的字段
excludes：来指定不想要显示的字段

二者都是可选的。

kibana 清空某个索引_elasticsearch_21

高级查询

布尔组合（bool)

bool把各种其它查询通过must（与）、must_not（非）、should（或）的方式进行组合

kibana 清空某个索引_字段_22

范围查询(range)

range 查询找出那些落在指定区间内的数字或者时间

kibana 清空某个索引_字段_23

模糊查询(fuzzy)

我们新增一个商品：

POST /heima/goods/4
{
    "title":"apple手机",
    "images":"http://image.leyou.com/12479122.jpg",
    "price":6899.00
}

fuzzy 查询是 term 查询的模糊等价。它允许用户搜索词条与实际词条的拼写出现偏差，但是偏差的编辑距离不得超过2

kibana 清空某个索引_elasticsearch_24

过滤(filter)

条件查询中进行过滤

所有的查询都会影响到文档的评分及排名。如果我们需要在查询结果中进行过滤，并且不希望过滤条件影响评分，那么就不要把过滤条件作为查询条件来用。而是使用filter方式：

kibana 清空某个索引_elasticsearch_25

无查询条件，直接过滤

如果一次查询只有过滤，没有查询条件，不希望进行评分，我们可以使用constant_score取代只有 filter 语句的 bool 查询。在性能上是完全相同的，但对于提高查询简洁性和清晰度有很大帮助。

kibana 清空某个索引_kibana 清空某个索引_26

排序

单字段排序

sort 可以让我们按照不同的字段进行排序，并且通过order指定排序的方式

kibana 清空某个索引_字段_27

多字段排序

假定我们想要结合使用 price和 _score（得分）进行查询，并且匹配的结果首先按照价格排序，然后按照相关性得分排序：

kibana 清空某个索引_数据_28

本文章为转载内容，我们尊重原作者对文章享有的著作权。如有内容错误或侵权问题，欢迎原作者联系我们进行内容更正或删除文章。

上一篇：支持BM25算法的python包

下一篇：多个输出python

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯