乐趣区

关于elasticsearch:elasticsearch-ik-分词器处理不当的问题

一、参考

elasticsearch 学习系列目录——更新 ing

elasticsearch analysis ik

分词时产生 NullPointerException

Elasticsearch 中为什么会有大量文档插入后变成 deleted?

二、场景形容

2.1 存在索引,然而文档 bulk 报错

2.2 查看索引统计信息

发现很多文档处于 deleted状态

三、起因探索

3.1 首先须要定位什么场景,文档状态会是 deleted?

通过调研,

操作 阐明
间接delete 间接删除文档,文档状态会变为deleted
更新文档update 更新操作实质是删除旧文档,增加新的文档,也会产生deleted 状态的文档

然而,程序中没有删除文档的操作?

3.2 是否因为资源有余,导致 ES 主动删除呢?

查看集群资源,因为是新的集群,所以资源根本未应用,不存在资源缓和问题

3.3 因为咱们应用了 ik 分词器,那么是否是分词器的起因呢?

因为咱们设置了 message 字段应用ik 分词器,发现果然是分词器的起因

四、解决形式

4.1 docker环境问题

docker中如同通过 elasticsearch-plugin install <URL>形式装置分词器,会有问题

批改装置形式,下载对应版本的ik zip 安装包,解压后,问题解决

退出移动版