关于elasticsearch:44elasticsearch搜索引擎的基本查询

【百度云搜寻,搜各种材料:http://www.lqkweb.com】
【搜网盘,搜各种材料:http://www.swpan.cn】

1、elasticsearch(搜索引擎)的查问

elasticsearch是性能十分弱小的搜索引擎,应用它的目标就是为了疾速的查问到须要的数据

查问分类:
  根本查问:应用elasticsearch内置的查问条件进行查问
  组合查问:把多个查问条件组合在一起进行复合查问
  过滤:查问同时,通过filter条件在不影响打分的状况下筛选数据

2、elasticsearch(搜索引擎)创立数据

首先咱们先创立索引、表、以及字段属性、字段类型、增加好数据

留神:个别咱们中文应用ik_max_word中文分词解析器,所有在须要分词建设倒牌索引的字段都要指定,ik_max_word中文分词解析器
零碎默认不是ik_max_word中文分词解析器

ik_max_word中文分词解析器是elasticsearch(搜索引擎)的一个插件,在elasticsearch装置目录的plugins/analysis-ik文件夹里,版本为5.1.1

更多阐明:https://github.com/medcl/elas…

阐明:

#创立索引(设置字段类型)
#留神:个别咱们中文应用ik_max_word中文分词解析器,所有在须要分词建设倒牌索引的字段都要指定,ik_max_word中文分词解析器
#零碎默认不是ik_max_word中文分词解析器
PUT jobbole                             #创立索引设置索引名称
{
  "mappings": {                         #设置mappings映射字段类型
    "job": {                            #表名称
      "properties": {                   #设置字段类型
        "title":{                       #表名称
          "store": true,                #字段属性true示意保留数据
          "type": "text",               #text类型,text类型能够分词,建设倒排索引
          "analyzer": "ik_max_word"     #设置分词解析器,ik_max_word是一个中文分词解析器插件
        },
        "company_name":{                #字段名称
          "store": true,                #字段属性true示意保留数据
          "type": "keyword"             #keyword一般字符串类型,不分词
        },
        "desc":{                        #字段名称
          "type": "text"                #text类型,text类型能够分词,然而没有设置分词解析器,应用零碎默认
        },
        "comments":{                    #字段名称
          "type": "integer"             #integer数字类型
        },
        "add_time":{                    #字段名称
          "type": "date",               #date工夫类型
          "format":"yyyy-MM-dd"         #yyyy-MM-dd工夫格式化
        }
      }
    }
  }
}
#保存文档(相当于数据库的写入数据)
POST jobbole/job
{
  "title":"python django 开发工程师",                 #字段名称:值
  "company_name":"美团科技有限公司",                   #字段名称:值
  "desc":"对django的概念相熟, 相熟python基础知识",     #字段名称:值
  "comments":20,                                    #字段名称:值
  "add_time":"2017-4-1"                             #字段名称:值
}

POST jobbole/job
{
  "title":"python scrapy redis 分布式爬虫根底",
  "company_name":"玉秀科技有限公司",
  "desc":"对scrapy的概念相熟, 相熟redis基础知识",
  "comments":5,
  "add_time":"2017-4-2"
}

POST jobbole/job
{
  "title":"elasticsearch打造搜索引擎",
  "company_name":"通信科技有限公司",
  "desc":"对elasticsearch的概念相熟",
  "comments":10,
  "add_time":"2017-4-3"
}

POST jobbole/job
{
  "title":"pyhhon打造举荐引擎零碎",
  "company_name":"智能科技有限公司",
  "desc":"相熟举荐引擎零碎算法",
  "comments":60,
  "add_time":"2017-4-4"
}

 通过下面能够看到咱们创立了索引并且设置好了字段的属性、类型、以及分词解析器,创立了4条数据

3、elasticsearch(搜索引擎)根本查问

match查问【用的最多】
会将咱们的搜索词在以后字段设置的分词器进行分词,到以后字段查找,匹配度越高排名靠前,如果搜索词是大写字母会自动转换成小写

#match查问
#会将咱们的搜索词进行分词,到指定字段查找,匹配度越高排名靠前
GET jobbole/job/_search
{
  "query": {
    "match": {
      "title": "搜索引擎"
    }
  }
}

term查问
不会将咱们的搜索词进行分词,将搜索词齐全匹配的查问

term查问

#不会将咱们的搜索词进行分词,将搜索词齐全匹配的查问
GET jobbole/job/_search
{
  "query": {
    "term": {
      "title":"搜索引擎"
    }
  }
}

terms查问
传递一个数组,将数组里的词别离匹配

#terms查问
#传递一个数组,将数组里的词别离匹配
GET jobbole/job/_search
{
  "query": {
    "terms": {
      "title":["工程师","django","零碎"]
    }
  }
}

管制查问的返回数量
  from从第几条数据开始
  size获取几条数据

#管制查问的返回数量
#from从第几条数据开始
#size获取几条数据 
GET jobbole/job/_search
{
  "query": {
    "match": {
      "title": "搜索引擎"
    }
  },
  "from": 0,
  "size": 3
}

match_all查问,查问所有数据

#match_all查问,查问所有数据
GET jobbole/job/_search
{
  "query": {
    "match_all": {}
  }
}

match_phrase查问
短语查问
短语查问,会将搜索词分词,放进一个列表如[python,开发]
而后搜寻的字段必须满足列表里的所有元素,才合乎
slop是设置分词后[python,开发]python 与 开发,之间隔着多少个字符算匹配
距离字符数小于slop设置算匹配到,距离字符数大于slop设置不匹配

#match_phrase查问
#短语查问
#短语查问,会将搜索词分词,放进一个列表如[python,开发]
#而后搜寻的字段必须满足列表里的所有元素,才合乎
#slop是设置分词后[python,开发]python 与 开发,之间隔着多少个字符算匹配
#距离字符数小于slop设置算匹配到,距离字符数大于slop设置不匹配
GET jobbole/job/_search
{
  "query": {
    "match_phrase": {
      "title": {
        "query": "elasticsearch引擎",
        "slop":3
      }
    }
  }
}

multi_match查问
比方能够指定多个字段
比方查问title字段和desc字段外面蕴含python的关键词数据
query设置搜索词
fields要搜寻的字段
title^3示意权重,示意title里合乎的关键词权重,是其余字段里合乎的关键词权重的3倍

#multi_match查问
#比方能够指定多个字段
#比方查问title字段和desc字段外面蕴含python的关键词数据
#query设置搜索词
#fields要搜寻的字段
#title^3示意权重,示意title里合乎的关键词权重,是其余字段里合乎的关键词权重的3倍
GET jobbole/job/_search
{
  "query": {
    "multi_match": {
      "query": "搜索引擎",
      "fields": ["title^3","desc"]
    }
  }
}

stored_fields设置搜寻后果只显示哪些字段

留神:应用stored_fields要显示的字段store属性必须为true,如果要显示的字段没有设置store属性那么默认为false,如果为false将不会显示该字段

#stored_fields设置搜寻后果只显示哪些字段
GET jobbole/job/_search
{
  "stored_fields": ["title","company_name"], 
  "query": {
    "multi_match": {
      "query": "搜索引擎",
      "fields": ["title^3","desc"]
    }
  }
}

通过sort搜寻后果排序
留神:排序的字段必须是数字或者日期
desc升序
asc降序

#通过sort搜寻后果排序
#留神:排序的字段必须是数字或者日期
#desc升序
#asc降序
GET jobbole/job/_search
{
  "query": {
    "match_all": {}
  },
  "sort": [{
      "comments": {
        "order": "asc"
      }
    }]
}

range字段值范畴查问
查问一个字段的值范畴
留神:字段值必须是数字或者工夫
gte大于等于
ge大于
lte小于等于
lt小于
boost是权重,能够给指定字段设置一个权重

#range字段值范畴查问
#查问一个字段的值范畴
#留神:字段值必须是数字或者工夫
#gte大于等于
#ge大于
#lte小于等于
#lt小于
#boost是权重,能够给指定字段设置一个权重
GET jobbole/job/_search
{
  "query": {
    "range": {
      "comments": {
        "gte": 10,
        "lte": 20,
        "boost": 2.0
      }
    }
  }
}

range字段值为工夫范畴查问

#range字段值为工夫范畴查问
#查问一个字段的工夫值范畴
#留神:字段值必须是工夫
#gte大于等于
#ge大于
#lte小于等于
#lt小于
#now为以后工夫
GET jobbole/job/_search
{
  "query": {
    "range": {
      "add_time": {
        "gte": "2017-4-1",
        "lte": "now"
      }
    }
  }
}

wildcard查问,通配符查问
*代表一个或者多个任意字符

#wildcard查问,通配符查问
#*代表一个或者多个任意字符
GET jobbole/job/_search
{
  "query": {
    "wildcard": {
      "title": {
        "value": "py*n",
        "boost": 2
      }
    }
  }
}

fuzzy含糊查问

#fuzzy含糊搜寻
#搜寻蕴含词的内容
GET lagou/biao/_search
{
  "query": {
    "fuzzy": {"title": "广告"}
  },
  "_source": ["title"]
}

#fuzziness设置编辑间隔,编辑间隔就是把要查找的字段值,编辑成查找的关键词须要编辑多少个步骤(插入、删除、替换)
#prefix_length为关键词后面不参加变换的长度
GET lagou/biao/_search
{
  "query": {
    "fuzzy": {
      "title": {
        "value": "广告录音",
        "fuzziness": 2,
        "prefix_length": 2
      }
    }
  },
  "_source": ["title"]
}

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理