elasticsearch学习笔记（五）——快速入门案例实战电商网站商品管理：集群健康检查，文档的CRUD

jiezi

6 年前

elasticsearch 和 kibana 都已经安装和启动了，下就开始进行实战了
1、document 数据格式
首先来讲一下 ES 为什么面向文档以及面向文档的好处。（1）一般应用系统的数据结构都是面向对象的，结构复杂，操作起来特别不方便。如果将对象数据存储到数据库中，只能拆解开来，变为扁平的多张表，每次查询的时候还得还原回对象格式，相当的麻烦。（2）ES 是面向文档的，文档中存储的数据结构，与面向对象的数据结构是一样的，基于这种文档的数据结构，es 可以提供复杂的索引，全文检索，分析聚合等的功能。（3）es 的 document 底层是用 json 数据格式来表达的，json 的优势就用说了，附上一篇文章来说明 https://blog.csdn.net/it_drea…
对象的数据结构：
public class Employee {
private String email;
private String firstName;
private String lastName;
private EmployeeInfo info;
private Date joinDate;
}

public class EmployeeInfo {
private String bio;
private Integer age;
private String[] interests;
}

EmployeeInfo info = new EmployeeInfo();
info.setBio(“curious and modest”);
info.setAge(30);
info.setInterests(new String[]{“bike”, “climb”});

Employee employee = new Employee();
employee.setEmail(“zhangsan@sina.com”);
employee.setFirstName(“san”);
employee.setLastName(“zhang”);
employee.setInfo(info);
employee.setJoinDate(new Date());
两张表：employee 表，employee_info 表，将 employee 对象的数据重新拆开来，变成 Employee 数据和 EmployeeInfo 数据 employee 表：email,first_name,last_name,join_date,4 个字段 employee_info 表：bio,age,interests,3 个字段从外还有一个外键字段，比如 employee_id 关联着 employee 表
ES 面向文档的 json 数据结构:
{
“email”:”zhangsan@sina.com”,
“first_name”:”san”,
“last_name”:”zhang”,
“info”: {
“bio”:”curious and modest”,
“age”:30,
“interests”:[“bike”, “climb”]
},
“join_date”:”2017/01/01″
}
这里我们就可以明白 ES 的 document 数据格式和数据库的关系型数据库的区别
2、电商网站商品管理案例背景介绍
有一个电商网站，需要为其基于 ES 构建一个后台系统，提供以下功能：（1）对商品信息进行 CRUD（增删改查）操作（2）执行简单的结构化查询（3）可以执行简单的全文检索，以及复杂的 phrase（短语）检索（4）对于全文检索的结果，可以进行高亮显示（5）对数据进行简单的聚合分析
3、简单的集群管理
（1）快速检查集群的健康状况
es 提供了一套 api，叫做 cat api, 可以查看 ES 的各种各样的配置以及状态数据
GET /_cat/health?v

epoch timestamp cluster status node.total node.data shards pri relo init unassign pending_tasks max_task_wait_time active_shards_percent
1555412142 10:55:42 elasticsearch green 1 1 2 2 0 0 0 0 – 100.0%

快速了解集群的健康状况，查看 status 参数值即可

green: 每个索引的 primary shard 和 replica shard 都是 active 状态
yellow: 每个索引的 primary shard 都是 active 状态，但是部分的 replica shard 不是 active 状态，处于不可用的状态
red: 不是所有的索引的 primary shard 都是 active 状态，部分索引有数据的丢失

（2）快速查看集群中有哪些索引
GET /_cat/indices?v

health status index uuid pri rep docs.count docs.deleted store.size pri.store.size
green open .kibana_task_manager q25yU7fCQlKw5PnMwe-IPA 1 0 2 0 45.5kb 45.5kb
green open .kibana_1 u3ZsZEtUQCiIFpng4Z-Mww 1 0 3 0 14.2kb 14.2kb

（3）简单的索引操作
创建索引
PUT /test_index?pretty

{
“acknowledged” : true,
“shards_acknowledged” : true,
“index” : “test_index”
}
删除索引
DELETE /test_index?pretty

{
“acknowledged” : true
}
（4）商品的 CRUD 操作
1、新增商品：新增文档，建立索引格式
PUT /{index}/{type}/{id}
{
“json 数据 ”
}
PUT /product/_doc/1
{
“name”:”gaolujie yagao”,
“desc”: “gaoxiao meibai”,
“price”:30,
“producer”:”gaolujie producer”,
“tags”:[“meibai”, “fangzhu”]
}

{
“_index” : “product”,
“_type” : “_doc”,
“_id” : “1”,
“_version” : 1,
“result” : “created”,
“_shards” : {
“total” : 2,
“successful” : 1,
“failed” : 0
},
“_seq_no” : 0,
“_primary_term” : 1
}

PUT /product/_doc/2
{
“name” : “jiajieshi yagao”,
“desc” : “youxiao fangzhu”,
“price” : 25,
“producer” : “jiajieshi producer”,
“tags”: [“fangzhu”]
}

PUT /product/_doc/3
{
“name”:”zhonghua yagao”,
“desc”: “caoben zhiwu”,
“price”:40,
“producer” :”zhonghua producer”,
“tags”:[“qingxin”]
}
这里不用事先创建好索引 index 和类型 type，ES 会默认对 document 每个 field 都建立倒排索引，让其可以被搜索 2、查询商品：检索文档格式：
GET /{index}/{type}/{id}
GET /product/_doc/1

{
“_index” : “product”,
“_type” : “_doc”,
“_id” : “1”,
“_version” : 1,
“_seq_no” : 0,
“_primary_term” : 1,
“found” : true,
“_source” : {
“name” : “gaolujie yagao”,
“desc” : “gaoxiao meibai”,
“price” : 30,
“producer” : “gaolujie producer”,
“tags” : [
“meibai”,
“fangzhu”
]
}
}
3、修改商品：替换文档格式：
PUT /{index}/{type}/{id}
{
“json 数据 ”
}
PUT /product/_doc/1
{
“name” : “jiaqiangban gaolujie yagao”,
“desc” : “gaoxiao meibai”,
“price” : 30,
“producer” : “gaolujie producer”,
“tags”: [“meibai”, “fangzhu”]
}

{
“_index” : “product”,
“_type” : “_doc”,
“_id” : “1”,
“_version” : 2,
“result” : “updated”,
“_shards” : {
“total” : 2,
“successful” : 1,
“failed” : 0
},
“_seq_no” : 3,
“_primary_term” : 1
}
替换方式有一个不好，替换时必须带上所有的 fields，才能达到我们想要的修改效果举个例子，如果执行
PUT /product/_doc/1
{
“name” : “jiaqiangban gaolujie yagao”
}
GET /product/_doc/1
{
“_index” : “product”,
“_type” : “_doc”,
“_id” : “1”,
“_version” : 3,
“_seq_no” : 4,
“_primary_term” : 1,
“found” : true,
“_source” : {
“name” : “jiaqiangban gaolujie yagao”
}
}

就不是我们想要的了 4、修改商品：更新文档格式
POST /{index}/_update/{id}
虽然本质还是一样的，但是进行替换处理的操作全部放在了 ES 内部，我们传输的数据只需要传需要修改的字段即可，大大降低了在批量处理时的网路带宽，提高了性能。下面是展示的例子：
GET /product/_doc/1
{
“_index” : “product”,
“_type” : “_doc”,
“_id” : “1”,
“_version” : 4,
“_seq_no” : 5,
“_primary_term” : 1,
“found” : true,
“_source” : {
“name” : “jiaqiangban gaolujie yagao”,
“desc” : “gaoxiao meibai”,
“price” : 30,
“producer” : “gaolujie producer”,
“tags” : [
“meibai”,
“fangzhu”
]
}
}
POST /product/_update/1
{
“doc”:{
“name”: “jiajieshi yagao”
}
}
GET /product/_doc/1
{
“_index” : “product”,
“_type” : “_doc”,
“_id” : “1”,
“_version” : 5,
“_seq_no” : 6,
“_primary_term” : 1,
“found” : true,
“_source” : {
“name” : “jiajieshi yagao”,
“desc” : “gaoxiao meibai”,
“price” : 30,
“producer” : “gaolujie producer”,
“tags” : [
“meibai”,
“fangzhu”
]
}
}
从这个例子就可以看出 update 操作成功了 5、删除商品：删除文档格式：
DELETE /{index}/{type}/{id}
DELETE /product/_doc/1
{
“_index” : “product”,
“_type” : “_doc”,
“_id” : “1”,
“_version” : 6,
“result” : “deleted”,
“_shards” : {
“total” : 2,
“successful” : 1,
“failed” : 0
},
“_seq_no” : 7,
“_primary_term” : 1
}