一、ES根底概念
1.简单的分布式机制,比方分片、正本、负载平衡等等,全副都暗藏起来
2.扩容计划(垂直扩容、程度扩容)
3.减少或者缩小节点时的数据rebalance:总有某些服务器的负载会重一些,承载的数量和申请量会大一些
4.mater节点:
(1)治理es集群的元数据,比如说索引的创立和删除,保护索引元数据;节点的减少和移除,保护集群的元数据
(2)默认状况下,会主动抉择出一台节点,作为mater节点
(3)mater节点不承载所有的申请,所以不会是单点瓶颈
5.节点对等的分布式架构
(1)节点对等,每个节点都能接管所有的申请
(2)节点的主动路由
二、shard和replica机制详解
- index蕴含多个shard
- 每个shard都是一个最小工作单元,承载局部数据
- 增减节点时,shard会主动的nodes中负载平衡
- 每个document只能存在于一个primary shard中。
- replica shrad是primary shard的正本,负责容错以及承当读申请负载
- primary shard的数量再创立索引的时候就固定了,replica shard的数据能够随时更改
- replica shard 不能和primary shard放在同一个节点上,然而能够和别的primary shard的replica shard 放在同一个节点
三、指定index的primary shard的数量
PUT /test_index
{
"settings":{
"number_of_shards":3,
"number_of_replicas":1
}
}
四、容错的过程
当有一个node宕机,这个机器上的某个primary shard 就没了,此时status就不是active,状态也会批改成red。
(1) 容错第一步:mater 选举,主动抉择另一个node成为新的mater,承当起master的责任
(2) 容错第二步:新的master,将失落掉的primary shard的某个replica shard晋升为primary shard,此时cluster status会变为yellow,因为primary shard 全副都变成了active。然而少了一个replica shard,所以不是所有的replica shard 都是active
(3)容错第三步:重启故障的node,新的mater会将缺失的正本都时copy一份到该node上,而且该node会应用之前已有的shard数据,只是同步一下宕机之后产生过的批改。cluster status 变为green。
发表回复