高度伸缩的开源全文本搜索和分析引擎,能够快速地存储、搜索、分析大数据,并且接近于实时(real time)。通常用于复杂的搜索功能和需求。
(一)特点
1、近乎实时(NRT)
正常情况下,构建索引(写)到结果可查询(读)在一秒间。
2、集群(Cluster)
一个或多个节点,集群持有整体数据,提供跨节点的索引和搜索能力。集群的名称必须是唯一的。
3、节点(Node)
指单台服务器,也是集群的组成单元,存储数据、参与集群的索引和搜索。其名称也是唯一的。
4、文档(Document)
数据存储基本单元。文档信息能被索引,并且采用JSON的格式传递。
5、索引(Index)
一些存在相似特征的文档集合。索引通过名称来区分(必须小写),并且该名称用于关联那些为文档构建索引、查询、更新、删除操作的索引。
6、类型(Type)
同一个索引可被定义多个类型。类型属于索引的逻辑分类。正如博文如文档,标签为类型。
7、Shards
一个索引可能存储大量的数据,这些数据可能超出了单节点的限制。为了解决这个问题,需要分而治之,这种技术即是 Shards。
目的:
水平伸缩
并行操作,增加吞吐量
8、Replicas
网络环境中,单点服务可能随时存在不可用,因此需要提供failover的机制,因此,Replicas的方式能够避免服务持续不可用。
目的:
高可用
提高吞吐量