ES常用的查询方式如下
  • term系列   精确搜素
  • match系列   精确搜索、模糊搜索
  • exists  指定字段存在(有值)
  • prefix  前缀匹配,只能是keyword类型的字段
  • wildcard  通配符
  • regexp   正则表达式匹配
  • ids   根据id进行查询

term系列

(1)term

POST 192.168.1.9:9200/mall/_search
{
"query":{
    "term":{
        "goods_name":"苹果"
    }
 }
}

既然是查询,那都是写在"query"字段里的。

匹配机制是equals,指定字段的值要相等才算匹配,返回所有匹配的document,即精确搜索。

如果是float这种数值型,10.0、10是equals的,也算匹配的。

(2)terms

POST 192.168.1.9:9200/mall/_search
{
"query":{
    "terms":{
        "goods_name":["桃子","梨子"]
    }
 }
}

数组,只要该字段的值是数组中的任意一个元素,就认为该文档匹配。

不管是term、还是terms,都只能写一个字段,不能使用多个字段进行查询。

分析一下返回的数据

{
    "took": 2,  #took是take的过去式,搜索花费的时间,ms
    "timed_out": false,  #本次搜索是否超时
    "_shards": {  #分片信息
        "total": 1,
        "successful": 1,
        "skipped": 0,
        "failed": 0
    },
    "hits": {
        "total": {  
            "value": 2,  #匹配的document的数量
            "relation": "eq"  #关系是匹配
        },
        "max_score": 1.0,  #最大的socre,ES会给每个document分配一个score,搜索结果按score升序排列
        "hits": [
            {
                "_index": "mall",  #index
                "_type": "_doc",  #type
                "_id": "2",  #document的id
                "_score": 1.0,  #score
                "_source": {  #数据
                    "goods_name": "桃子",
                    "goods_price": 3.0,
                    "goods_description": "新鲜桃子,3元一斤"
                }
            },
            {
                "_index": "mall",
                "_type": "_doc",
                "_id": "3",
                "_score": 1.0,
                "_source": {
                    "goods_name": "梨子",
                    "goods_price": 5.0,
                    "goods_description": "新鲜桃子,5元一斤"
                }
            }
        ]
    }
}

match系列

(1)match_all 

POST 192.168.1.9:9200/mall/_search
{
"query":{
    "match_all":{
        
    }
 }
}

返回所有的document,match_all里面不能写字段

(2)match 、match_phrase

POST 192.168.1.9:9200/mall/_search
{
"query":{
    "match":{
        "goods_description":"梨子"
    }
 }
}

如果使用text类型的字段,会使用分词器分词进行匹配,比如上面会拆分为"梨"、"子"2个字符,只要商品描述中含有“梨”字或"子"字,就认为该文档匹配,即模糊搜索。

如果match中写text之外的字段,比如写keyword类型,那效果和term一样,都是精确匹配。

match、match_phrase的效果、使用方式都一样,都只能写一个字段。

(3)multi_match

POST 192.168.1.9:9200/mall/_search
{
 "query": {
    "multi_match": {
        "query":"苹果",
        "fields":["goods_name","goods_descriptioon"]
     }
 }
}

multi_match可以写多个字段,只要某一个字段匹配了,就认为该文档匹配。

商品名称匹配“苹果”或商品描述匹配“苹果”,就认为该文档匹配。text类型是模糊匹配,其它类型是精确匹配。

(4)match_phrase_prefix

POST 192.168.1.9:9200/mall/_search
{
 "query": {
    "match_phrase_prefix": {
        "goods_description":"子"
     }
 }
}

模糊匹配。只能写一个字段,且该字段必须是text类型。

 exists

POST mall/_search
{
  "query":{
    "exists":{
      "field": "goods_description"
    }
  }
}

只要指定字段有值(存在),就认为该文档匹配

prefix

POST mall/_search
{
  "query":{
    "prefix":{
      "goods_name": "梨"
    }
  }
}

prefix中只能写text或keyword类型的字段。

prefix只对keyword类型的字段有效,该字段的值以指定字符串开头,就认为该文档匹配。

也能写text类型的字段,但返回值是空

wildcard

POST mall/_search
{
  "query":{
    "wildcard":{
      "goods_name": "*瓜"
    }
  }
}

值可以使用通配符,*表示任意字符串,?表示任意一个字符。

wildcard是精确匹配,值必须equals才能匹配。比如"*瓜"可以匹配"冬瓜"、"哈密瓜",但匹配不了"冬瓜苗"。

regexp   正则表达式匹配

POST mall/_search
{
  "query":{
    "regexp":{
      "goods_name":".*瓜"
    }
  }
}

使用的正则表达式和java中的有一点区别:不能使用\系列的规则,比如不能使用\w。

精确匹配,值要完全匹配才算。使用的字段要是text类型。

ids

POST mall/_search
{
  "query":{
    "ids":{
      "values":[1,2,3]
    }
  }
}

根据id来查询,如果有该id,就返回对应的文档。

数值型id引不引都行,非数值型id需要引起来。

没有id这种查询方式,就算只查一个id,也要写成数组形式。

说明

  • 使用GET、POST均可
  • 返回的是所有匹配的文档
  • 使用哪个字段进行匹配,可以由用户指定,前端给出搜索选项“按标题进行搜索”、“按内容进行搜索”......也可以使用固定的字段进行搜索,比如搜索商品,只按商品名称进行搜索。

     值由用户输入,前端把搜索框的值传递给后台,后台查询ES。

(text字段似乎和分词器有关,如果该text字段使用内置分词器,无效,返回空;使用第三方分词器,有效,效果和keyword相同)

  •  结果可分页,只返回结果集中指定的文档
POST 192.168.1.9:9200/mall/_search
{
     "query": {
    
     },
     "from":0,  #从结果集中的第1个文档开始
    "size":20  #取20个文档。结果集中的文档是按score升序排列的。       
}