共计 2413 个字符,预计需要花费 7 分钟才能阅读完成。
本文首发于公众号:Hunter 后端
原文链接:es 笔记五之 term-level 的查问操作
官网文档上写的是 term-level queries,表义为基于精确值的对文档的查问,能够了解为对 keyword 类型或者 text 类型分词为 keyword 的字段进行 term 模式的准确查找。
以下是本篇笔记目录:
- 是否存在值
- 前缀搜寻
- 大小于操作
- term 查问
- terms 查问
- wildcard 查问
1、是否存在值
exists 查问某个字段是否存在值。
还是应用上篇笔记讲的 exam 这个 index,咱们创立一条数据,只给定 name 的值,那么 address 的值就 null,或者说查问返回的数据就没有这个字段了。
PUT /exam/_doc/12
{"name" : "test"}
而后咱们查问 address 字段有值的数据:
GET /exam/_search
{
"query": {
"exists": {"field": "address"}
}
}
就能够发现返回的数据中没有咱们创立的这条数据,或者咱们取反操作,查问 address 字段没有值的数据:
GET /exam/_search
{
"query": {
"bool": {
"must_not": [{"exists": {"field": "address"}}
]
}
}
}
2、前缀搜寻
对于咱们在后面创立的这条数据:
PUT /exam/_doc/16
{
"name" : "张三丰",
"address": "一个苹果"
}
如果是 name 字段,因为它是一个 keyword 类型,所以它是一个整体不会被分词解决,咱们能够搜寻 name 的值为 ‘ 张 ’, ‘ 张三 ’ 和 ‘ 张三丰 ’ 都能够搜寻到。
GET /exam/_search
{
"query": {
"prefix": {
"name": {"value": "张"}
}
}
}
然而对于 address 字段,发现是能够搜寻到 ‘ 一 ’,’ 一个 ’ 和 ‘ 苹果 ’,然而搜寻 ‘ 一个苹 ’,或者 ‘ 一个苹果 ’ 是搜不到后果的。
GET /exam/_search
{
"query": {
"prefix": {
"address": {"value": "一个苹"}
}
}
}
咱们能够看一下 ‘ 一个苹果 ’ 的分词后果:
GET /exam/_doc/16/_termvectors?fields=address
能够发现能够搜寻到的词都在以分词后果的结尾或者全副,然而 ‘ 一个苹 ’ 是没有分词后果以此为结尾的。
所以这里咱们的搜寻操作是基于 address 字段的分词后果列表来查问的。
如果想要搜寻到从 ‘ 一 ’ 开始到结尾之间任意地点截断的数据,咱们就须要将 address 字段作为一个整体来搜寻,那就是加上 .keyword 来操作。
GET /exam/_search
{
"query": {
"prefix": {
"address.keyword": {"value": "一个苹"}
}
}
}
3、大小于操作
后面介绍了 gt, gte, lt, lte 的操作是在 bool 下的 filter 里操作,这里咱们能够间接放到 query 下:
GET /bank/_search
{
"query": {
"range": {
"age": {
"gte": 10,
"lte": 20
}
}
}
}
4、term 查问
后面介绍过 term 查问是一种准确查问,然而官网文档揭示咱们应该尽量避免对 text 字段应用 term 查问,因为 text 类型的数据在写入的时候会被分词,通过 term 查问咱们可能搜寻不到想要的查问的数据。同时倡议咱们查问 text 字段该当应用 match 操作。
咱们应用官网文档提供的一个示例来阐明为什么应该尽量避免应用 term 查问来查问 text 字段,其实后面咱们介绍过相干的示例,这里独自拿进去做一下阐明。
还是应用咱们后面用过的索引 exam,咱们来写入一条数据:
PUT /exam/_doc/18
{"address": "quick brown foxes"}
而后咱们想要搜寻 ‘quick brown foxes’ 这个字符串,应用上面的操作:
GET /exam/_search
{
"query": {
"term": {
"address": {"value": "quick brown foxes"}
}
}
}
这个必定是搜寻不到的,因为这个字符串在写入的时候曾经被分词解决了,而 term 是一个准确查找,相当于搜寻一整个字符串,这就必定搜寻不到了。
然而咱们能够应用 match,match 操作会在搜寻前先对搜寻的字符串进行分词解决,而后进行匹配操作,所以应用上面的操作是能够搜寻到数据的:
GET /exam/_search
{
"query": {
"match": {"address": "quick brown foxes"}
}
}
后面还介绍过,如果想要搜寻一整个 address 的值为咱们搜寻的字符串内容,能够应用 address.keyword:
GET /exam/_search
{
"query": {
"term": {"address.keyword": "quick brown foxes"}
}
}
5、terms 查问
如果想要同时搜寻多个准确字段值,比方搜寻 “quick” 和 “ 苹果 ”,就能够应用 terms:
GET /exam/_search
{
"query": {
"terms": {"address": ["quick", "苹果"]
}
}
}
### 6、wildcard 查问
wildcard 是通配符的意思,这里的用法有点相似于前缀的操作,都是通过符号来实现更为随便的匹配。
这里有两个通配符,一个是 *,一个是 ?
*
的作用是 0 到 n 个字符长度
比方我搜寻 qui* 就能够查到 quick 的数据:
GET /exam/_search
{
"query": {
"wildcard": {
"address": {"value": "qui*"}
}
}
}
?
的作用是匹配任意单个字符,比方咱们搜寻 qui?k,也能够查问到这条数据:
GET /exam/_search
{
"query": {
"wildcard": {
"address": {"value": "qui?k"}
}
}
}
如果想获取更多后端相干文章,可扫码关注浏览: