elasticsearch学习笔记（十）——Elasticsearch横向扩容过程与容错机制

tigercn

2019-07-01

下面简单描述一下Elasticsearch横向扩容过程与容错机制

1、横向扩容过程

对于ES默认创建的索引有10个shard,其中有5个是primary shard，5个是replica shard。
在ES内部会自动做一些事情：
（1）primary shard & replica shard会自动负载均衡。均匀的分布在各个节点
（2）保持每个节点node拥有更少的shard，IO/CPU/Memory资源给每个shard分配更多，使得每个shard性能更好
（3）Elasticsearch的扩容极限，由于有10个shard（5个primary shard,5个replica shard），所以最多可以扩容到6台机器，此时每个shard可以占用单台服务器的所有资源，性能最好。
（4）如果超出扩容的极限，可以动态的修改replica数量，比如将replica修改为2，那么就有15个分片（5个primary shard，10个replica shard），此时就可以扩容到15台机器，比之前拥有更高的读吞吐量。
（5）如果只有5台机器，15个分片（5个primary shard,10个replica shard），每个shard占用的资源会更少，但是容错性会比10个分片的要好，此时最多可以容纳2台机器宕机，而10个分片只能容纳1台机器宕机。
这些知识点告诉我们，一方面扩容应该怎么去扩，怎么去提升系统整体的吞吐量；另一方面还要考虑到系统的容错性，怎样提高系统的容错性，让尽可能多的服务器宕机，不会造成数据的丢失。

2、容错机制详解

elasticsearch学习笔记（十）——Elasticsearch横向扩容过程与容错机制

场景描述:
假设master node1节点宕机的一瞬间，P0，P1,P2,P3,P4这些primary shard就没了，也就是说此时就不是active status
下面是ES做的容错的一个过程：
第一步：master选举，自动选择另一台node作为新的master节点，承担起master的责任来
第二步：新的master node2将丢失掉primary shard的某个replica shard提升为primary shard。此时cluster status就会变为yellow，因为primary shard全部变成active了，但是少了一个replica shard，所以就不是所有的replica shard都是active的
第三步：重启故障的node,新的master会将缺失的副本都copy一份到该node上去。而且该node会使用之前已有的shard数据，只是同步一下宕机之后发生过的修改。cluster的状态变为green，因为primary shard和replica shard都齐全了。

elasticsearch 容错机制 replica

安科网

elasticsearch学习笔记（十）——Elasticsearch横向扩容过程与容错机制

tigercn

1、横向扩容过程

2、容错机制详解

tigercn

相关推荐

Elasticsearch py客户端库安装及使用方法解析

ElasticSearch最全详细使用教程

十张图说清Elasticsearch原理！

ElasticSearch 交互使用

django 对接elasticsearch实现全文检索

Spring Boot 集成 Elasticsearch 实战

如何对 ElasticSearch 集群进行压力测试

操作ElasticSearch插件和可视化工具 Kibana

Elasticsearch实战 | match_phrase搜不出来，怎么办？

Elasticsearch聚合后分页深入详解

Elasticsearch大文件检索性能提升20倍实践（干货）

重磅 | 死磕Elasticsearch方法论认知清单（国庆更新版）

Elasticsearch实战 | 必要的时候，还得空间换时间!

Elasticsearch索引增量统计及定时邮件实现

如何在Linux下安装部署分布式全文搜索引擎

ElasticSearch的下载、安装使用

我也是才知道ElasticSearch条件更新是这么玩的

读写成功率达99.999%，提升ElasticSearch系统稳定性的秘密

es快照备份到minio

Elasticsearch是一把梭，用起来再说？！

tigercn