CAP演化之BASE理论

枫叶上的雨露

2020-04-25

关注关注

CAP理论及BASE理论的关系

base理论是在cap理论的基础上发展的，cap描述了分布式系统中数据一致性，可用性，分区容错性之间的制约关系。当你选择其中两个的时候，就不得不对另外一个做出一定的牺牲。

base理论则是对cap理论的实际应用，也就是在分区和副本存在的前提下，通过一定的系统设计方案，放弃强一致性，实现基本可用，这是大部分分布式系统的选择。在这个前提下，如何把基本可用做到最好，则是我们追求的目标。

BASE理论

base是三个单词的缩写，是指基本可用（Basically Available）、软状态（Soft State）和最终一致性（Eventually Consistent）。

CAP演化之BASE理论

base理论的核心思想是最终一致性，即放弃强一致性（Strong Consistency），应用根据自身的业务特点，采用适当的方式来使系统达到最终一致性（Eventual Consistency）。

基本可用

cap中可用性是指任何时候，读写都是成功的，base的基本可用也就是不追求cap中的任何时候，读写都是成功，而是系统能够基本运行，一直提供服务。基本可用强调了分布式系统在出现不可预知故障的时候，允许损失部分可用性，相比正常的系统，可能是响应时间延长，或者是服务被降级

举个例子，在双十一秒杀活动中，如果抢购人数太多超过了系统的 QPS 峰值，可能会排队或者提示限流，这就是通过合理的手段保护系统的稳定性，保证主要的服务正常，保证基本可用。

CAP演化之BASE理论

软状态

软状态可以对应 ACID 事务中的原子性，在 ACID 的事务中，实现的是强制一致性，要么全做要么不做，所有用户看到的数据一致。其中的原子性（Atomicity）要求多个节点的数据副本都是一致的，强调数据的一致性。

原子性可以理解为一种“硬状态”，软状态则是允许系统中的数据存在中间状态，并认为该状态不影响系统的整体可用性，即允许系统在多个不同节点的数据副本存在数据延时。

最终一致性

数据不可能一直是软状态，必须在一个时间期限之后达到各个节点的一致性，在期限过后，应当保证所有副本保持数据一致性，也就是达到数据的最终一致性。

在系统设计中，最终一致性实现的时间取决于网络延时、系统负载、不同的存储选型、不同数据复制方案设计等因素。

不同数据一致性模型

一般来说，数据一致性模型可以分为强一致性和弱一致性，强一致性也叫做线性一致性，除此以外，所有其他的一致性都是弱一致性的特殊情况。弱一致性根据不同的业务场景，又可以分解为更细分的模型，不同一致性模型又有不同的应用场景。

在互联网领域的绝大多数场景中，都需要牺牲强一致性来换取系统的高可用性，系统往往只需要保证“最终一致性”，只要这个最终时间是在用户可以接受的范围内即可。

CAP演化之BASE理论

对于一致性，可以分为从服务端和客户端两个不同的视角，这里关注的主要是外部一致性。

强一致性

当更新操作完成之后，任何多个后续进程的访问都会返回最新的更新过的值，这种是对用户最友好的，就是用户上一次写什么，下一次就保证能读到什么。根据 CAP 理论，这种实现需要牺牲可用性。

弱一致性

系统在数据写入成功之后，不承诺立即可以读到最新写入的值，也不会具体的承诺多久之后可以读到。用户读到某一操作对系统数据的更新需要一段时间，我们称这段时间为“不一致性窗口”。

最终一致性

最终一致性是弱一致性的特例，强调的是所有的数据副本，在经过一段时间的同步之后，最终都能够达到一个一致的状态。因此，最终一致性的本质是需要系统保证最终数据能够达到一致，而不需要实时保证系统数据的强一致性。

到达最终一致性的时间，就是不一致窗口时间，在没有故障发生的前提下，不一致窗口的时间主要受通信延迟，系统负载和复制副本的个数影响。

最终一致性模型根据其提供的不同保证可以划分为更多的模型，包括因果一致性和会话一致性等。

因果一致性

因果一致性要求有因果关系的操作顺序得到保证，非因果关系的操作顺序则无所谓。

进程 A 在更新完某个数据项后通知了进程 B，那么进程 B 之后对该数据项的访问都应该能够获取到进程 A 更新后的最新值，并且如果进程 B 要对该数据项进行更新操作的话，务必基于进程 A 更新后的最新值。

因果一致性的应用场景可以举个例子，在微博或者微信进行评论的时候，比如你在朋友圈发了一张照片，朋友给你评论了，而你对朋友的评论进行了回复，这条朋友圈的显示中，你的回复必须在朋友之后，这是一个因果关系，而其他没有因果关系的数据，可以允许不一致。

会话一致性

会话一致性将对系统数据的访问过程框定在了一个会话当中，约定了系统能保证在同一个有效的会话中实现“读己之所写”的一致性，就是在你的一次访问中，执行更新操作之后，客户端能够在同一个会话中始终读取到该数据项的最新值。

实际开发中有分布式的 Session 一致性问题，可以认为是会话一致性的一个应用。

分布式一致性可用性 base

安科网

CAP演化之BASE理论

枫叶上的雨露

CAP理论及BASE理论的关系

BASE理论

基本可用

软状态

最终一致性

不同数据一致性模型

强一致性

弱一致性

最终一致性

因果一致性

会话一致性

枫叶上的雨露

相关推荐

分布式基础理论之CAP 和BASE

Zookeeper入门一篇就够了

分布式 - 一步步深入（理论汇总）

阿里P8架构师谈：分布式数据库数据一致性的原理、与技术实现方案

分布式事务的现象及理解

HBase可用性分析与高可用实践

CAP Theorem

分布式数据存储与管理

Redis（Remote Dictionary Server）

分布式系统的CAP和BASE理论

浅谈 CAP 和 Paxos 共识算法

如何保证分布式系统数据一致性？这六种方案你不该错过

从ACID到CAP/BASE

并发到底带来了什么问题？

分布式CAP原则

DDD分布式架构设计的BASE一致性

一致性Hash

图解什么是一致性哈希算法

一致性HASH算法在分布式应用场景使用

数据分布算法：hash+ 一致性 hash + redis cluster 的 hash slot

枫叶上的雨露