2.1 ElasticSearch索引

2.1.1 分片和副本

在elasticserch.yml可以设置分布和副本的数量。
副本可以在生产环境随意控制,但是分片不好修改,但具体数量不好定位。
2.1.2 创建索引
修改索引的自动创建
action.auto_create_index: false
这里在其他地方检索,构建索引的默认属性有哪些
2.2 映射配置
2.2.1 类型确定机制
模式映射(schema mapping,或简称映射)用于定义索引结构

类型定义
JSON对象中包含不同类型
字段
每种类型包含不同属性
核心类型
介绍常见的构建类型
//
分析器
各种强化解析文档的插件武器

2.2.3 相似度模型

相关相似度模型
Okapi BM25模型随机性偏差信息基础
(1) 配置DFR相似度模型
(2) 配置IB相似度模型

2.3 批量索引以提高索引速度

2.3.1 为批量索引准备数据

在索引中增加或更换现有文档(index);
从索引中移除文档(delete);
当索引中不存在其他文档定义时,在索引中增加新文档(create)

2.3.3 更快的批量请求

采用UDP协议

2.4用附加的内部信息扩展索引结构

_uid字段
_id字段

_type字段

_all字段

_source字段

_index字段

_size字段

_timestamp字段

_ttl字段

2.5 段合并介绍

段合并,将若干段合创建一个新的段,包含之前的信息。
合并的必要性在于有时候,只是逻辑删除了,很多数据还是占据服务器内存的。
合并策略:
tiered:这是默认合并策略,合并尺寸大致相似的段
log_byte_size:这个合并策略下,随着时间推移,将产生由索引大小的对数构成的索
引,其中存在着一些较大的段以及一些合并因子较小的段等
log_doc:这个策略类似于log_byte_size合并策略,但根据索引中的文档数而非段的
实际字节数来操作

2.6 路由的介绍

路由可以控制文档和查询转发的目的分片。
最简单的方法(但并不总是最方便的一个)是使用路由参数来提供路由值。
Elasticsearch的请求指定路由值并不方便。事实上,在索引过程中,Elasticsearch
允许指定一个字段,用该字段的值作为路由值。