本文翻译自:www.elastic.co/guide/en/el…

本文是Elasticsearch的入门文档,将会介绍ElasticSearch中的查询语言。

查询语言

Elasticsearch提供了一种可用于执行查询的特定于域的JSON风格的的语言。这被称为查询DSL。查询语言相当全面,第一次接触可能会让人恐慌,但实际学习的最佳方式是从几个基本的例子开始。

回到我们的最后一个例子,我们执行了这个查询:

GET /bank/_search
{
  "query": { "match_all": {} }
}复制代码

解析上面的内容,查询部分告诉我们什么是查询定义,而match_all部分就是我们要运行的查询类型。 match_all查询只是搜索指定索引中的所有文档。

除了query参数外,我们还可以传递其他参数来影响搜索结果。在上面的例子中,我们通过sort,这里我们传递size

GET /bank/_search
{
  "query": { "match_all": {} },
  "size": 1
}复制代码

请注意,如果未指定size,则默认为10。

此示例执行match_all并返回文档11至20:

GET /bank/_search
{
  "query": { "match_all": {} },
  "from": 10,
  "size": 10
}复制代码

from参数(基于0)指定要从哪个文档索引开始,size参数指定从from参数开始返回多少文档。实现分页搜索结果时,此功能非常有用。请注意,如果未指定from,则默认为0。

此示例执行match_all,并按结果按降序按帐户余额排序,并返回前10名(默认大小)文档。

GET /bank/_search
{
  "query": { "match_all": {} },
  "sort": { "balance": { "order": "desc" } }
}复制代码

执行搜索

现在我们已经看到了一些基本的搜索参数,我们再来看一下查询DSL。我们先来看看返回的文档字段。默认情况下,完整的JSON文档作为所有搜索的一部分返回。这被称为源(搜索匹配中的_source字段)。如果我们不希望返回整个源文档,我们有能力仅从源代码中请求几个字段被返回。

此示例显示如何从搜索中返回两个字段account_numberbalance_source内部):

GET /bank/_search
{
  "query": { "match_all": {} },
  "_source": ["account_number", "balance"]
}复制代码

请注意,上述示例简单地减少_source字段。它仍然只返回一个名为_source的字段,但在其中只包含字段account_numberbalance

如果你有SQL技术背景,上述内容在概念上与SQL SELECT FROM字段列表有些相似。

现在我们来看看查询部分。前面,我们已经看到了如何使用match_all查询来匹配所有文档。现在我们来介绍一个称为match query的新查询,可以将其视为基本的字段搜索查询(即针对特定字段或一组字段进行搜索)。此示例返回的帐号为20:

GET /bank/_search
{
  "query": { "match": { "account_number": 20 } }
}复制代码

此示例返回在地址中包含术语“mill”的所有帐户:

GET /bank/_search
{
  "query": { "match": { "address": "mill" } }
}复制代码

此示例返回在地址中包含术语“mill”或“lane”的所有帐户:

GET /bank/_search
{
  "query": { "match": { "address": "mill lane" } }
}复制代码

此示例是match(match_phrase)的变体,它返回所有包含地址中的“mill lane”短语的帐户:

GET /bank/_search
{
  "query": { "match_phrase": { "address": "mill lane" } }
}复制代码

现在介绍一下bool query。 bool query
允许我们使用布尔逻辑将较小的查询组合成较大的查询。

此示例组成两个match查询,并返回包含“mill”和“lane”的所有帐户在地址中:

GET /bank/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}复制代码

在上面的例子中,bool must子句指定文档被认为是匹配的所有查询必须为true。

相比之下,此示例组成两个match查询,并返回地址中包含“mill”或“lane”的所有帐户:

GET /bank/_search
{
  "query": {
    "bool": {
      "should": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}复制代码

在上面的例子中,bool should子句指定一个查询列表,匹配文档中的任意一个为true。

此示例组成两个匹配查询,并返回在地址中既不包含“mill”也不包含“lane”的所有帐户:

GET /bank/_search
{
  "query": {
    "bool": {
      "must_not": [
        { "match": { "address": "mill" } },
        { "match": { "address": "lane" } }
      ]
    }
  }
}复制代码

在上面的示例中,bool must_not子句指定了一个查询列表,对于一个被认为是匹配的文档,它们都不是true。

我们可以在一个bool查询中同时结合使用must,should和must_not子句。此外,我们可以在任何这些bool子句中组合bool查询,以模拟任何复杂的多级布尔逻辑。

此示例返回所有40岁,但state不是ID的人的所有帐户:

GET /bank/_search
{
  "query": {
    "bool": {
      "must": [
        { "match": { "age": "40" } }
      ],
      "must_not": [
        { "match": { "state": "ID" } }
      ]
    }
  }
}复制代码