关于java:elastic-stack-那些事4

search api

实现对es中存储的数据进行查问剖析，endpoint为_search，如 GET /_search
查问有两种模式

URI search
Request body search
es 提供的齐备的查问语法 Query DSL domain specific language

URI search

通过url query参数来实现搜寻，罕用参数如下：

q 指定查问的语句，语法为query string syntax
df q 中不指定字段时默认查问的字段，如果不指定，es 会查问所有的字段
sort 排序
timeout 指定超时工夫

from size 分页

 GET /my_index/_search?q=alfred&df=user&sort=age:asc&from=4&size=10&timeout=1s
 查问user字段中蕴含alfred的文档，后果依照age升序排列，返回第5-14个文档，如果超时1s则完结

term and phrase

alfred way 等于 alfred OR way
“alfred way” 词语查问要求先后顺序
泛查问
alfred 等效与在所有的字段取匹配该term
在指定字段
name:alfred

Group 分组

group分组设定，应用括号指定匹配规定

(quick OR brown) AND fox
status:(active OR pending) title:(full text search)

boolean 操作符

AND OR NOT

name:(tom NOT leee)
必须大写

+-对应must 和 must_not

name:(tom +lee -alfred)
name:((lee && !alfred) || (tom && lee && !alfred))
- 在url中会被解析为空格要应用encode后后果才能够 %2B

范畴查问

范畴查问反对数值和日期

区间写法闭区间用[] 开区间用{}
1. age:[1 TO 10]
2. age:[1 TO 10}
3. age:[1 TO] age>=1
4. age:[* TO 10] age<=10
算数符号写法
1. age:>=1
2. age:(>=1 && <=10)
3. age:(+>=1 +<=10)

通配符正则表达式

？代表一个字符 * 代表0或者多个字符
通配符匹配执行效率低，占用内存大，不倡议应用
如无非凡需要，不要将?/*放在最前
name:/[ab]oat/ 正则表白的问题和通配符一样

含糊匹配近似度查问

含糊匹配 fuzzy query

name:roam~1 匹配与roam差一个character的词例如 foam roams

近似度查问 proximity search

“fox quick”~5 以 term为单位进行差别比拟，例如”quick fox” “quick brown fox” 都会被匹配

Query DSL

基于json定义的查询语言，次要蕴含如下两种类型

字段类查问
如 term match range 等只针对某一个字段进行查问
复合查问
如 boolean 查问蕴含一个或多个字段类查问或者复合查问语句

字段类查问

全文匹配
针对text类型的字段进行全文检索，回对查问语句进行分词解决，如match match_phrase 等query类型
单词匹配
不会对查问语句做分词解决，间接去匹配字段的倒排索引如 term terms range 等query类型
minimum_should_match 管制须要匹配的单词数

match phrase query

对字段进行检索，有程序要求
应用slop参数管制单词之间的距离

query string query

相似与uri search中的q参数查问

simple query string query

相似于query string 然而会疏忽谬误的查问语法，并且反对局部查问语法
罕用的逻辑符号如下，不能应用 and or not 等关键词

- 为 AND
| 为 OR
- 为 NOT

term query

一次传入多个单词不做分词查问

range query

数值和日期的范畴查问

date math

针对日期提供一种更敌对的计算形式
now – 1d
基准日期，也能够是更具体的日期，例如 2018-01-01 应用具体日期时要用 || 做隔离
计算公式次要有三种

- 1h
- 1d
/d 将工夫舍入到天

复合查问

蕴含字段类查问或复合类查问的类型

constant_score query
该查问将其外部的查问后果文档得分都设定为1 或者 boost的值
多用于联合bool查问实现自定义得分
bool query
由一个或多个布尔子句组成，次要蕴含一下4个
1. filter 值过滤复合条件的文档不计算相关性得分
  1. es针对filer有只能缓存，提高效率
  2. 做简略的匹配查问且不思考算分时，举荐应用filter代替query
2. must 文档必须复合must中所有条件会影响相关性得分
3. must_not 文档必须不合乎must_not中所有的条件
4. should 文档能够复合should 中的条件，会影响相关性得分

count and source api

count 获取复合条件的文档数
source 只返回局部字段

关于java:elastic-stack-那些事4

search api

URI search

term and phrase

Group 分组

boolean 操作符

范畴查问

通配符正则表达式

含糊匹配近似度查问

Query DSL

字段类查问

相关性算分

match phrase query

query string query

simple query string query

term query

range query

date math

复合查问

count and source api

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于java:elastic-stack-那些事4

search api

URI search

term and phrase

Group 分组

boolean 操作符

范畴查问

通配符 正则表达式

含糊匹配 近似度查问

Query DSL

字段类查问

相关性算分

match phrase query

query string query

simple query string query

term query

range query

date math

复合查问

count and source api

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

通配符正则表达式

含糊匹配近似度查问

发表回复取消回复