高度伸缩的开源全文本搜索和分析引擎,能够快速地存储、搜索、分析大数据,并且接近于实时(real time)。通常用于复杂的搜索功能和需求。

(一)特点
  1、近乎实时(NRT)
  正常情况下,构建索引(写)到结果可查询(读)在一秒间。

  2、集群(Cluster)
  一个或多个节点,集群持有整体数据,提供跨节点的索引和搜索能力。集群的名称必须是唯一的。

  3、节点(Node)
  指单台服务器,也是集群的组成单元,存储数据、参与集群的索引和搜索。其名称也是唯一的。

  4、文档(Document)
  数据存储基本单元。文档信息能被索引,并且采用JSON的格式传递。

  5、索引(Index)
  一些存在相似特征的文档集合。索引通过名称来区分(必须小写),并且该名称用于关联那些为文档构建索引、查询、更新、删除操作的索引。

  6、类型(Type)
  同一个索引可被定义多个类型。类型属于索引的逻辑分类。正如博文如文档,标签为类型。

  7、Shards
  一个索引可能存储大量的数据,这些数据可能超出了单节点的限制。为了解决这个问题,需要分而治之,这种技术即是 Shards。
  目的:
    水平伸缩
    并行操作,增加吞吐量

  8、Replicas
  网络环境中,单点服务可能随时存在不可用,因此需要提供failover的机制,因此,Replicas的方式能够避免服务持续不可用。
  目的:
    高可用
    提高吞吐量