ElasticSerach基础概念知识梳理_ES

ES概念介绍

Elaticsearch,简称为ES, ES是一个开源的高扩展的分布式全文搜索引擎,是整个Elastic Stack技术栈的核心。它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理PB级别的数据。

1、ES核心概念组成

ElasticSerach基础概念知识梳理_数据库_02

● 引 index:一个索引相当于一个关系数据库的数据库

● 类型 type:一种type相当于关系数据库的一类数据表,在ES 7.x默认type为_doc

ES 5.x中一个索引(index)可以有多种type

ES 6.x中一个索引(index)只能有一种type

ES 7.x版本以后,将逐步淡化type这个概念,现在的操作已经不再使用,默认_doc

● 映射 mapping:mapping定义了每个字段的类型、字段所使用的分词器信息。相当于关系型数据库中的表结构。

● 文档 document:一个document相当于关系型数据库中数据表的一行记录

● 倒排索引:一个倒排索引由文档中所有不重复词的列表构成,对于其中每个词都有包含它的文档id列表

● 字段 field:相当于关系型数据库表的字段名称

2、ES数据类型介绍

2.1 字符串型

text:用于全文索引,该类型的字段将通过分词器 进行分词

keyword:不进行分词,只能搜索该字段的完整的值

2.2 数值型

long, integer, short, byte, double, float, half_float, scaled_float

2.3 布尔型 boolean

boolean JSON 中的 “true”、“false”、true、false 都可以

2.4 二进制类型 binary

该类型的字段把值当做经过 base64 编码的字符串,默认不存储,且不可搜索

2.5 范围类型

范围类型表示值是一个范围,而不是一个具体的值

integer_range, float_range, long_range, double_range, date_range

比如:age 的类型是 integer_range,如果存储的值是 {"gte" : 18, "lte" : 90};搜索 "term" : {"age": 60} 可以查询到该值

2.6 日期型 date

因为Json没有date类型,所以es通过识别字符串是否符合format定义的格式来判断是否满足date类型

format默认为:strict_date_optional_time||epoch_millis

"2023-01-31" "2023/01/31 12:10:30" 类似这种字符串格式

2.7 复杂数据类型

● 数组:[ ] Nested: nested (数组类型的JSON对象)

比如:[ { "name": "小张", "age": 30 }, { "name": "小李", "age": 35 }]

● 对象:{ } Object: object(单个JSON对象)

比如:{ "name": "小李", "age": 35 }