阿里大神带你领略Java一致性算法的风骚!(Paxos、Zab、Raft、选举、NWR、Hash、Gossip)

阿里大神带你领略Java一致性算法的风骚!(Paxos、Zab、Raft、选举、NWR、Hash、Gossip)

image.png

5. Gossip

Gossip 算法又被称为反熵(Anti-Entropy),熵是物理学上的一个概念,代表杂乱无章,而反熵
就是在杂乱无章中寻求一致,这充分说明了 Gossip 的特点:在一个有界网络中,每个节点都随机
地与其他节点通信,经过一番杂乱无章的通信,最终所有节点的状态都会达成一致。每个节点可
能知道所有其他节点,也可能仅知道几个邻居节点,只要这些节可以通过网络连通,最终他们的
状态都是一致的,当然这也是疫情传播的特点。

6. 一致性 Hash

一致性哈希算法(Consistent Hashing Algorithm)是一种分布式算法,常用于负载均衡。
Memcached client 也选择这种算法,解决将 key-value 均匀分配到众多 Memcached server 上
题。它可以取代传统的取模操作,解决了取模操作无法应对增删 Memcached Server 的问题
(增删 server 会导致同一个 key,在 get 操作时分配不到数据真正存储的 server,命中率会急剧下
降)。

6.1. 一致性 Hash 特性

  • 平衡性(Balance):平衡性是指哈希的结果能够尽可能分布到所有的缓冲中去,这样可以使得
    所有的缓冲空间都得到利用。
  • 单调性(Monotonicity):单调性是指如果已经有一些内容通过哈希分派到了相应的缓冲中,
    又有新的缓冲加入到系统中。哈希的结果应能够保证原有已分配的内容可以被映射到新的缓
    冲中去,而不会被映射到旧的缓冲集合中的其他缓冲区。容易看到,上面的简单求余算法
    hash(object)%N 难以满足单调性要求。
  • 平滑性(Smoothness):平滑性是指缓存服务器的数目平滑改变和缓存对象的平滑改变是一致
    的。

6.2. 一致性 Hash 原理

1.建构环形 hash 空间:

  • 考虑通常的 hash 算法都是将 value 映射到一个 32 为的 key 值,也即是 0~2^32-1 次方的
    数值空间;我们可以将这个空间想象成一个首( 0 )尾( 2^32-1 )相接的圆环。

2.把需要缓存的内容(对象)映射到 hash 空间

  • 接下来考虑 4 个对象 object1~object4 ,通过 hash 函数计算出的 hash 值 key 在环上的分

3.把服务器(节点)映射到 hash 空间

  • Consistent hashing 的基本思想就是将对象和 cache 都映射到同一个 hash 数值空间中,并
    且使用相同的 hash 算法。一般的方法可以使用 服务器(节点) 机器的 IP 地址或者机器名作为
    hash 输入。

4.把对象映射到服务节点

  • 现在服务节点和对象都已经通过同一个 hash 算法映射到 hash 数值空间中了,首先确定对象
    hash 值在环上的位置,从此位置沿环顺时针“行走”,第一台遇到的服务器就是其应该定位
    到的服务器。

考察 cache 的变动

  1. 通过 hash 然后求余的方法带来的最大问题就在于不能满足单调性,当 cache 有所变动时,
    cache 会失效。
  • 移除 cache:考虑假设 cache B 挂掉了,根据上面讲到的映射方法,这时受影响的将仅是
    那些沿 cache B 逆时针遍历直到下一个 cache ( cache C )之间的对象。
  • 添加 cache:再考虑添加一台新的 cache D 的情况,这时受影响的将仅是那些沿 cache
    D 逆时针遍历直到下一个 cache 之间的对象,将这些对象重新映射到 cache D 上即可。

虚拟节点
hash 算法并不是保证绝对的平衡,如果 cache 较少的话,对象并不能被均匀的映射到 cache 上,
为了解决这种情况, consistent hashing 引入了“虚拟节点”的概念,它可以如下定义:
虚拟节点( virtual node )是实际节点在 hash 空间的复制品( replica ),一实际个节点对应了
若干个“虚拟节点”,这个对应个数也成为“复制个数”,“虚拟节点”在 hash 空间中以 hash
值排列。
仍以仅部署 cache A 和 cache C 的情况为例。现在我们引入虚拟节点,并设置“复制个数”为 2 ,
这就意味着一共会存在 4 个“虚拟节点”, cache A1, cache A2 代表了 cache A; cache C1,
cache C2 代表了 cache C 。此时,对象到“虚拟节点”的映射关系为:
objec1->cache A2 ; objec2->cache A1 ; objec3->cache C1 ; objec4->cache C2 ;
因此对象 object1 和 object2 都被映射到了 cache A 上,而 object3 和 object4 映射到了 cache
C 上;平衡性有了很大提高。
引入“虚拟节点”后,映射关系就从 { 对象 -> 节点 } 转换到了 { 对象 -> 虚拟节点 } 。查询物体所
在 cache 时的映射关系如下图 所示。

阿里大神带你领略Java一致性算法的风骚!(Paxos、Zab、Raft、选举、NWR、Hash、Gossip)

image.png

文章均来自互联网如有不妥请联系作者删除QQ:314111741 地址:http://www.mqs.net/post/11947.html

相关阅读

  • 产品推广的方式有哪些(79种推广方式总有一种适合你)

    产品推广的方式有哪些(79种推广方式总有一种适合你)

    产品的推广是企业的一个重要环节。产品的推广,不仅是让消费者了解产品,而且还能够让企业在网络上获取更多品牌影响力。只有做好了产品推广,才能够让企业在品牌建设中取得更大的成就。那么产品推广应该怎么做?不同的产品使用不同推广法。但任何一...

    2025.12.09 02:51:31作者:iseeyuTags:推广
  • 淘宝怎么运营推广(中小卖家必学的操作思路)

    淘宝怎么运营推广(中小卖家必学的操作思路)

    淘宝在很长一段时间内,一直被认为是中国最大的电子商务平台。人们在这里购物,与在别处购物一样,会感觉到很便捷、很实惠。因此,随着电商行业的发展。如今,淘宝网站的活跃用户数已经超过了1亿人(目前该数据仅统计了部分用户)。而作为一个淘宝...

    2025.12.09 01:56:09作者:iseeyuTags:运营
  • 新电商平台:抖音小店店铺运营、选品秘籍

    新电商平台:抖音小店店铺运营、选品秘籍

    核心导读: 在前几年互联网兴起时代,流量比较分散,搜索引擎是当时互联网流量的入口,那时候互联网生意如果想要获取流量,都是需要向搜索引擎去购买,竞价获取流量。所以当时以百度为主的搜索引擎等,成为了获取互联网流量的主要来源。 直至现在,...

    2025.12.08 21:54:02作者:iseeyuTags:万物尝鲜节淘宝网搜索引擎美好一直在身边

添加新评论