一致性hash算法

horizonheart

2013-06-20

在做服务器负载均衡时候可供选择的负载均衡的算法有很多，包括：轮循算法（Round Robin）、哈希算法（HASH）、最少连接算法（Least Connection）、响应速度算法（Response Time）、加权法（Weighted ）等。其中哈希算法是最为常用的算法.

典型的应用场景是：有N台服务器提供缓存服务，需要对服务器进行负载均衡，将请求平均分发到每台服务器上，

每台机器负责1/N的服务。

常用的算法是对hash结果取余数 (hash() mod N)：对机器编号从0到N-1，按照自定义的hash()算法，对每个请求的hash()值按N取模，得到余数i，然后将请求分发到编号为i的机器。但这样的算法方法存在致命问题，如果某一台机器宕机，那么应该落在该机器的请求就无法得到正确的处理，这时需要将当掉的服务器从算法从去除，此时候会有(N- 1)/N的服务器的缓存数据需要重新进行计算；如果新增一台机器，会有N /(N+1)的服务器的缓存数据需要进行重新计算。对于系统而言，这通常是不可接受的颠簸（因为这意味着大量缓存的失效或者数据需要转移）。那么，如何设计一个负载均衡策略，使得受到影响的请求尽可能的少呢？

在Memcached、Key-Value Store、Bittorrent DHT、LVS中都采用了Consistent Hashing算法，可以说Consistent Hashing 是分布式系统负载均衡的首选算法。

1、Consistent Hashing算法描述 下面以Memcached中的Consisten Hashing算法为例说明（参考memcached的分布式算法）。由于hash算法结果一般为unsigned int型，因此对于hash函数的结果应该均匀分布在[0,2^32-1]间，如果我

们把一个圆环用2^32个点来进行均匀切割，首先按照hash(key)函数算出服务器（节点）的哈希值，并将其分布

到0～2^32的圆上。用同样的hash(key)函数求出需要存储数据的键的哈希值，并映射到圆上。然后从数据映射到的位置开始顺时针

查找，将数据保存到找到的第一个服务器（节点）上。

一致性hash算法

Consistent Hashing原理示意图

新增一个节点的时候，只有在圆环上新增节点逆时针方向的第一个节点的数据会受到影响。删除一个节点的时候，只有在圆环上原来删除节点顺时针方向的第一个节点的数据会受到影响，因此通过Consistent Hashing很好地解决了负载均衡中由于新增节点、删除节点引起的hash值颠簸问题。

一致性hash算法
Consistent Hashing添加服务器示意图

虚拟节点（virtual nodes）：之所以要引进虚拟节点是因为在服务器（节点）数较少的情况下（例如只有3台服务器），通过hash(key)算出节点的哈希值在圆环上并不是均匀分布的（稀疏的），仍然会出现各节点负载不均衡的问题。虚拟节点可以认为是实际节点的复制品（replicas），本质上与实际节点实际上是一样的（key并不相同）。引入虚拟节点后，通过将每个实际的服务器（节点）数按照一定的比例(例如200倍)扩大后并计算其hash(key)值以均匀分布到圆环上。在进行负载均衡时候，落到虚拟节点的哈希值实际就落到了实际的节点上。由于所有的实际节点是按照相同的比例复制成虚拟节点的，因此解决了节点数较少的情况下哈希值在圆环上均匀分布的问题。

一致性hash算法

虚拟节点对Consistent Hashing结果的影响

从上图可以看出，在节点数为10个的情况下，每个实际节点的虚拟节点数为实际节点的100-200倍的时候，结果还是很均衡的。

hash函数节点服务器分布式一致性负载均衡 hash 算法

安科网

一致性hash算法

horizonheart

horizonheart

相关推荐

Consistent Hashing算法

一致性Hash算法

php hash算法实现memcached分布式

mysql对于很长的字符列的索引方案

加解密原理

webpack 中，hash、chunkhash、contenthash 的区别是什么？

python3 一致性hash算法

9.算法之顺序、二分、hash查找

布隆过滤器(Bloom Filter)与Hash算法

HashMap源码分析

python hash

HashMap、lru、散列表

MySQL 索引结构 hash 有序数组

面试必看！凭借着这份 MySQL 高频面试题，我拿到了京东，字节的offer！

PHP弱类型hash比较缺陷

一致性哈希算法 CARP 原理解析, 附 Golang 实现

字典的key都可以是什么

Hash算法：双重散列

mysql 一些小问题

这可能是史上最全的MySQL面试题分享了，看完直接收藏

horizonheart