关于后端:es笔记五之termlevel的查询操作

48次阅读

共计 2413 个字符,预计需要花费 7 分钟才能阅读完成。

本文首发于公众号:Hunter 后端
原文链接:es 笔记五之 term-level 的查问操作

官网文档上写的是 term-level queries,表义为基于精确值的对文档的查问,能够了解为对 keyword 类型或者 text 类型分词为 keyword 的字段进行 term 模式的准确查找。

以下是本篇笔记目录:

  1. 是否存在值
  2. 前缀搜寻
  3. 大小于操作
  4. term 查问
  5. terms 查问
  6. wildcard 查问

1、是否存在值

exists 查问某个字段是否存在值。

还是应用上篇笔记讲的 exam 这个 index,咱们创立一条数据,只给定 name 的值,那么 address 的值就 null,或者说查问返回的数据就没有这个字段了。

PUT /exam/_doc/12
{"name" : "test"}

而后咱们查问 address 字段有值的数据:

GET /exam/_search
{
  "query": {
    "exists": {"field": "address"}
  }
}

就能够发现返回的数据中没有咱们创立的这条数据,或者咱们取反操作,查问 address 字段没有值的数据:

GET /exam/_search
{
  "query": {
    "bool": {
      "must_not": [{"exists": {"field": "address"}}
      ]
    }
  }
}

2、前缀搜寻

对于咱们在后面创立的这条数据:

PUT /exam/_doc/16
{
    "name" : "张三丰",
    "address": "一个苹果"
}

如果是 name 字段,因为它是一个 keyword 类型,所以它是一个整体不会被分词解决,咱们能够搜寻 name 的值为 ‘ 张 ’, ‘ 张三 ’ 和 ‘ 张三丰 ’ 都能够搜寻到。

GET /exam/_search
{
  "query": {
    "prefix": {
      "name": {"value": "张"}
    }
  }
}

然而对于 address 字段,发现是能够搜寻到 ‘ 一 ’,’ 一个 ’ 和 ‘ 苹果 ’,然而搜寻 ‘ 一个苹 ’,或者 ‘ 一个苹果 ’ 是搜不到后果的。

GET /exam/_search
{
  "query": {
    "prefix": {
      "address": {"value": "一个苹"}
    }
  }
}

咱们能够看一下 ‘ 一个苹果 ’ 的分词后果:

GET /exam/_doc/16/_termvectors?fields=address

能够发现能够搜寻到的词都在以分词后果的结尾或者全副,然而 ‘ 一个苹 ’ 是没有分词后果以此为结尾的。

所以这里咱们的搜寻操作是基于 address 字段的分词后果列表来查问的。

如果想要搜寻到从 ‘ 一 ’ 开始到结尾之间任意地点截断的数据,咱们就须要将 address 字段作为一个整体来搜寻,那就是加上 .keyword 来操作。

GET /exam/_search
{
  "query": {
    "prefix": {
      "address.keyword": {"value": "一个苹"}
    }
  }
}

3、大小于操作

后面介绍了 gt, gte, lt, lte 的操作是在 bool 下的 filter 里操作,这里咱们能够间接放到 query 下:

GET /bank/_search
{
  "query": {
    "range": {
      "age": {
        "gte": 10,
        "lte": 20
      }
    }
  }
}

4、term 查问

后面介绍过 term 查问是一种准确查问,然而官网文档揭示咱们应该尽量避免对 text 字段应用 term 查问,因为 text 类型的数据在写入的时候会被分词,通过 term 查问咱们可能搜寻不到想要的查问的数据。同时倡议咱们查问 text 字段该当应用 match 操作。

咱们应用官网文档提供的一个示例来阐明为什么应该尽量避免应用 term 查问来查问 text 字段,其实后面咱们介绍过相干的示例,这里独自拿进去做一下阐明。

还是应用咱们后面用过的索引 exam,咱们来写入一条数据:

PUT /exam/_doc/18
{"address": "quick brown foxes"}

而后咱们想要搜寻 ‘quick brown foxes’ 这个字符串,应用上面的操作:

GET /exam/_search
{
  "query": {
    "term": {
      "address": {"value": "quick brown foxes"}
    }
  }
}

这个必定是搜寻不到的,因为这个字符串在写入的时候曾经被分词解决了,而 term 是一个准确查找,相当于搜寻一整个字符串,这就必定搜寻不到了。

然而咱们能够应用 match,match 操作会在搜寻前先对搜寻的字符串进行分词解决,而后进行匹配操作,所以应用上面的操作是能够搜寻到数据的:

GET /exam/_search
{
  "query": {
    "match": {"address": "quick brown foxes"}
  }
}

后面还介绍过,如果想要搜寻一整个 address 的值为咱们搜寻的字符串内容,能够应用 address.keyword:

GET /exam/_search
{
  "query": {
    "term": {"address.keyword": "quick brown foxes"}
  }
}

5、terms 查问

如果想要同时搜寻多个准确字段值,比方搜寻 “quick” 和 “ 苹果 ”,就能够应用 terms:

GET /exam/_search
{
  "query": {
    "terms": {"address": ["quick", "苹果"]
    }
  }
}

### 6、wildcard 查问

wildcard 是通配符的意思,这里的用法有点相似于前缀的操作,都是通过符号来实现更为随便的匹配。

这里有两个通配符,一个是 *,一个是 ?

* 的作用是 0 到 n 个字符长度

比方我搜寻 qui* 就能够查到 quick 的数据:

GET /exam/_search
{
  "query": {
    "wildcard": {
      "address": {"value": "qui*"}
    }
  }
}

? 的作用是匹配任意单个字符,比方咱们搜寻 qui?k,也能够查问到这条数据:

GET /exam/_search
{
  "query": {
    "wildcard": {
      "address": {"value": "qui?k"}
    }
  }
}

如果想获取更多后端相干文章,可扫码关注浏览:

正文完
 0