关于elasticsearch:elasticsearch之重建索引

32次阅读

共计 2967 个字符,预计需要花费 8 分钟才能阅读完成。

[TOC]

elasticsearch 应用工夫长了后,总是有各种起因重建索引,然而 ES 是不反对索引字段类型变更的,起因是一个字段的类型进行批改之后,ES 会从新建设对这个字段的索引信息,影响到 ES 对该字段分词形式,相关度,TF/IDF 倒排创立等。网上有很多不进行服务的状况下使得 ES 索引字段类型变更的文章,本文基于 elasticsearch 7.12 的版本记录下重建索引的步骤

索引重建的步骤

  1. 创立 oldindex
  2. 给索引创立别名
  3. 向 oldindex 中插入 9 条数据
  4. 创立新的索引 newindex
  5. 重建索引
  6. 实现不重启服务索引的切换

创立 oldindex

curl -H "Content-type: application/json" -XPUT "http://localhost:9200/oldindex" -d'{"mappings": {"properties": {"name": {"type":"text"},"price": {"type":"double"}
        }
    }
}'

给索引创立别名

curl -H "Content-type: application/json" -XPUT "http://localhost:9200/oldindex/_alias/alias_oldindex"

向 oldindex 中插入 9 条数据

curl -H "Content-type: application/json" -XPOST "http://localhost:9200/alias_oldindex/_doc/_bulk" -d'{"create":{"_id":1}}
{"name":"name 01","price":1}
{"create":{"_id":2}}
{"name":"name 02","price":2}
{"create":{"_id":3}}
{"name":"name 03","price":3}
{"create":{"_id":4}}
{"name":"name 04","price":4}
{"create":{"_id":5}}
{"name":"name 05","price":5}
{"create":{"_id":6}}
{"name":"name 06","price":6}
{"create":{"_id":7}}
{"name":"name 07","price":7}
{"create":{"_id":8}}
{"name":"name 08","price":8}
{"create":{"_id":9}}
{"name":"name 09","price":9}
'

创立新的索引 newindex

curl -H "Content-type: application/json" -XPUT "http://localhost:9200/newindex" -d'{"mappings": {"properties": {"name": {"type":"text"},"price": {"type":"double"}
        }
    }
}'

重建索引

  • 数据量大的话能够异步执⾏,如果 reindex 工夫过⻓,倡议加上 wait_for_completion=false 的参数条件,这样 reindex 将间接返回 taskId

    curl -H "Content-type: application/json" -XPOST "http://localhost:9200/_reindex?wait_for_completion=false" -d'{"size": 5, // 示意只获取 5 条数据插入到新的索引中"conflicts":"proceed", // 如果新的索引中数据抵触,程序持续往下执行,删除程序会终止"source": {"size": 2, // 默认状况下,_reindex 应用 1000 进行批量操作,调整批量插入 2 条"index":"oldindex", // 示意从 oldindex, 类型 product 中查问出 price 字段的值"_source": ["price"],"query": {"range": {"price": {"gte": 2,"lte": 8}
              }
          }
      }, 
      "dest": {
          "index": "item_new_index", // 示意数据插入新索引 newindex 中
          "op_type": "create", // 数据插入的类型为创立,如果存在就会版本抵触
          "routing": "=routingvalue" // 数据插入时以什么值做路由
      }
    }'
  • 通过返回 taskId, 查问 reIndex 进度

    # {"task":"lJu4zixnS46ezdyKi8vqKw:630107100"}
    # 从异步获取 taskid 为 lJu4zixnS46ezdyKi8vqKw:630107100
    # GET _tasks?actions=*reindex&wait_for_completion=true&timeout=10s
    curl "http://localhost:9200/_tasks/lJu4zixnS46ezdyKi8vqKw:630107100"
  • 勾销 reIndex 工作

    # POST _tasks/_cancel?nodes=nodeId1,nodeId2&actions=*reindex
    curl -H "Content-type: application/json" -XPOST "http://localhost:9200/_tasks/lJu4zixnS46ezdyKi8vqKw:630107100/_cancel"

实现不重启服务索引的切换

curl -H "Content-type: application/json" -XPOST "http://localhost:9200/_aliases" -d'{"actions": [
    {
      "remove": {
        "index": "oldindex",
        "alias": "alias_oldindex"
      }
    },
    {
      "add": {
        "index": "newindex",
        "alias": "alias_oldindex"
      }
    }
  ]
}'

删除旧索引

curl  -XDELETE "http://localhost:9200/oldindex"

通过给 item_index 索引减少新字段的形式实现索引字段类型变更

1. 执行一下语句给 item_index 新增字段 itemNo

PUT item_index/_mapping/_doc

{

    "properties": {

        "itemNo": {"type":   "keyword"}

    }

}

2. 应用代码程序初始化字段 itemNo,行将老的索引字段 itemId 值刷新到 itemNo 中

3. 批改代码程序,应用 itemNo 代替 itemId

4.itemId 字段废除不应用了然而会保留在 item_index 索引中

针对以上批改索引字段类型的办法批改思考的点

1. 进行以上操作的时候,倡议先对索引建设快照备份。

2. 如果 item_index 索引中文档很多,reindex 操作会耗时比拟久,消耗 ES 服务的资源,影响 ES 服务的的性能。

3. 查问 ES 的磁盘空间是否足够 reindex 新的索引。

3.reindex 过程中,原索引新增的数据,是没有被 reindex 过来,思考到是否由数据失落。

5. 在 reindex 索引代价比拟大的时候能够应用给索引新增字段的形式实现索引字段类型的变更。

正文完
 0