【百度云搜寻,搜各种材料:http://www.lqkweb.com】
【搜网盘,搜各种材料:http://www.swpan.cn】
1、elasticsearch(搜索引擎)的查问
elasticsearch是性能十分弱小的搜索引擎,应用它的目标就是为了疾速的查问到须要的数据
查问分类:
根本查问:应用elasticsearch内置的查问条件进行查问
组合查问:把多个查问条件组合在一起进行复合查问
过滤:查问同时,通过filter条件在不影响打分的状况下筛选数据
2、elasticsearch(搜索引擎)创立数据
首先咱们先创立索引、表、以及字段属性、字段类型、增加好数据
留神:个别咱们中文应用ik_max_word中文分词解析器,所有在须要分词建设倒牌索引的字段都要指定,ik_max_word中文分词解析器
零碎默认不是ik_max_word中文分词解析器
ik_max_word中文分词解析器是elasticsearch(搜索引擎)的一个插件,在elasticsearch装置目录的plugins/analysis-ik文件夹里,版本为5.1.1
更多阐明:https://github.com/medcl/elas...
阐明:
#创立索引(设置字段类型)#留神:个别咱们中文应用ik_max_word中文分词解析器,所有在须要分词建设倒牌索引的字段都要指定,ik_max_word中文分词解析器#零碎默认不是ik_max_word中文分词解析器PUT jobbole #创立索引设置索引名称{ "mappings": { #设置mappings映射字段类型 "job": { #表名称 "properties": { #设置字段类型 "title":{ #表名称 "store": true, #字段属性true示意保留数据 "type": "text", #text类型,text类型能够分词,建设倒排索引 "analyzer": "ik_max_word" #设置分词解析器,ik_max_word是一个中文分词解析器插件 }, "company_name":{ #字段名称 "store": true, #字段属性true示意保留数据 "type": "keyword" #keyword一般字符串类型,不分词 }, "desc":{ #字段名称 "type": "text" #text类型,text类型能够分词,然而没有设置分词解析器,应用零碎默认 }, "comments":{ #字段名称 "type": "integer" #integer数字类型 }, "add_time":{ #字段名称 "type": "date", #date工夫类型 "format":"yyyy-MM-dd" #yyyy-MM-dd工夫格式化 } } } }}#保存文档(相当于数据库的写入数据)POST jobbole/job{ "title":"python django 开发工程师", #字段名称:值 "company_name":"美团科技有限公司", #字段名称:值 "desc":"对django的概念相熟, 相熟python基础知识", #字段名称:值 "comments":20, #字段名称:值 "add_time":"2017-4-1" #字段名称:值}POST jobbole/job{ "title":"python scrapy redis 分布式爬虫根底", "company_name":"玉秀科技有限公司", "desc":"对scrapy的概念相熟, 相熟redis基础知识", "comments":5, "add_time":"2017-4-2"}POST jobbole/job{ "title":"elasticsearch打造搜索引擎", "company_name":"通信科技有限公司", "desc":"对elasticsearch的概念相熟", "comments":10, "add_time":"2017-4-3"}POST jobbole/job{ "title":"pyhhon打造举荐引擎零碎", "company_name":"智能科技有限公司", "desc":"相熟举荐引擎零碎算法", "comments":60, "add_time":"2017-4-4"}
通过下面能够看到咱们创立了索引并且设置好了字段的属性、类型、以及分词解析器,创立了4条数据
3、elasticsearch(搜索引擎)根本查问
match查问【用的最多】
会将咱们的搜索词在以后字段设置的分词器进行分词,到以后字段查找,匹配度越高排名靠前,如果搜索词是大写字母会自动转换成小写
#match查问#会将咱们的搜索词进行分词,到指定字段查找,匹配度越高排名靠前GET jobbole/job/_search{ "query": { "match": { "title": "搜索引擎" } }}
term查问
不会将咱们的搜索词进行分词,将搜索词齐全匹配的查问
term查问
#不会将咱们的搜索词进行分词,将搜索词齐全匹配的查问GET jobbole/job/_search{ "query": { "term": { "title":"搜索引擎" } }}
terms查问
传递一个数组,将数组里的词别离匹配
#terms查问#传递一个数组,将数组里的词别离匹配GET jobbole/job/_search{ "query": { "terms": { "title":["工程师","django","零碎"] } }}
管制查问的返回数量
from从第几条数据开始
size获取几条数据
#管制查问的返回数量#from从第几条数据开始#size获取几条数据 GET jobbole/job/_search{ "query": { "match": { "title": "搜索引擎" } }, "from": 0, "size": 3}
match_all查问,查问所有数据
#match_all查问,查问所有数据GET jobbole/job/_search{ "query": { "match_all": {} }}
match_phrase查问
短语查问
短语查问,会将搜索词分词,放进一个列表如[python,开发]
而后搜寻的字段必须满足列表里的所有元素,才合乎
slop是设置分词后[python,开发]python 与 开发,之间隔着多少个字符算匹配
距离字符数小于slop设置算匹配到,距离字符数大于slop设置不匹配
#match_phrase查问#短语查问#短语查问,会将搜索词分词,放进一个列表如[python,开发]#而后搜寻的字段必须满足列表里的所有元素,才合乎#slop是设置分词后[python,开发]python 与 开发,之间隔着多少个字符算匹配#距离字符数小于slop设置算匹配到,距离字符数大于slop设置不匹配GET jobbole/job/_search{ "query": { "match_phrase": { "title": { "query": "elasticsearch引擎", "slop":3 } } }}
multi_match查问
比方能够指定多个字段
比方查问title字段和desc字段外面蕴含python的关键词数据
query设置搜索词
fields要搜寻的字段
title^3示意权重,示意title里合乎的关键词权重,是其余字段里合乎的关键词权重的3倍
#multi_match查问#比方能够指定多个字段#比方查问title字段和desc字段外面蕴含python的关键词数据#query设置搜索词#fields要搜寻的字段#title^3示意权重,示意title里合乎的关键词权重,是其余字段里合乎的关键词权重的3倍GET jobbole/job/_search{ "query": { "multi_match": { "query": "搜索引擎", "fields": ["title^3","desc"] } }}
stored_fields设置搜寻后果只显示哪些字段
留神:应用stored_fields要显示的字段store属性必须为true,如果要显示的字段没有设置store属性那么默认为false,如果为false将不会显示该字段
#stored_fields设置搜寻后果只显示哪些字段GET jobbole/job/_search{ "stored_fields": ["title","company_name"], "query": { "multi_match": { "query": "搜索引擎", "fields": ["title^3","desc"] } }}
通过sort搜寻后果排序
留神:排序的字段必须是数字或者日期
desc升序
asc降序
#通过sort搜寻后果排序#留神:排序的字段必须是数字或者日期#desc升序#asc降序GET jobbole/job/_search{ "query": { "match_all": {} }, "sort": [{ "comments": { "order": "asc" } }]}
range字段值范畴查问
查问一个字段的值范畴
留神:字段值必须是数字或者工夫
gte大于等于
ge大于
lte小于等于
lt小于
boost是权重,能够给指定字段设置一个权重
#range字段值范畴查问#查问一个字段的值范畴#留神:字段值必须是数字或者工夫#gte大于等于#ge大于#lte小于等于#lt小于#boost是权重,能够给指定字段设置一个权重GET jobbole/job/_search{ "query": { "range": { "comments": { "gte": 10, "lte": 20, "boost": 2.0 } } }}
range字段值为工夫范畴查问
#range字段值为工夫范畴查问#查问一个字段的工夫值范畴#留神:字段值必须是工夫#gte大于等于#ge大于#lte小于等于#lt小于#now为以后工夫GET jobbole/job/_search{ "query": { "range": { "add_time": { "gte": "2017-4-1", "lte": "now" } } }}
wildcard查问,通配符查问
*代表一个或者多个任意字符
#wildcard查问,通配符查问#*代表一个或者多个任意字符GET jobbole/job/_search{ "query": { "wildcard": { "title": { "value": "py*n", "boost": 2 } } }}
fuzzy含糊查问
#fuzzy含糊搜寻#搜寻蕴含词的内容GET lagou/biao/_search{ "query": { "fuzzy": {"title": "广告"} }, "_source": ["title"]}#fuzziness设置编辑间隔,编辑间隔就是把要查找的字段值,编辑成查找的关键词须要编辑多少个步骤(插入、删除、替换)#prefix_length为关键词后面不参加变换的长度GET lagou/biao/_search{ "query": { "fuzzy": { "title": { "value": "广告录音", "fuzziness": 2, "prefix_length": 2 } } }, "_source": ["title"]}