详解RAC集群中cache fushion原理
概念
有朋友问了我关于RAC的缓存融合方面,想了下头条好像还没发出来,这里总结下这方面内容。要了解 RAC 工作原理的中心,需要知道 Cache Fusion 这个重要的概念,要发挥 Cache Fusion 的作用,要有一个前提条件,那就是互联网络的速度要比访问磁盘的速度要快。否则,没有引入 Cache Fusion 的意义。
简单地说,缓存融合就是把Oracle RAC数据库中所有数据库缓存作为一个共享的数据库缓存,并被RAC中的所有节点共享。它是实现RAC的基本技术。
cache fushion功能
缓存融合主要有如下四个功能:
(1) 提供扩展性的传输。
(2) 在实例间传输数据库的映射。
(3) 跟踪资源的当前位置和状态。
(4) 在每个实例的SGA的目录结构中保存资源信息。
上图每个节点都运行一个数据库实例,每个实例包含一组Oracle进程和用于缓存的系统全局区(SGA)。除了这些集群中的每个节点都还运行着一组特殊的进程:全局缓存服务进程(GCS)和全局队列服务进程(GES),GES主要负责维护字典缓存和库缓存内的一致性,GCS主要负责协调不同实例间对数据块的访问,它们通过Global Resource Directory(GRD)来维护和记录每个数据块的状态,使其在群集中的各个节点之间同步和串行处理对数据的访问。同时,每个数据区块又分别属于某一个节点,对于这个数据区块来说,这个节点称为主节点(Master)。为了在服务器之间均衡工作负载,群集中所有服务器都可以成为部分数据块的主节点,GCS 是oracle 用来实施缓存融合的机制。
缓存融合工作原理
很多朋友都知道Oracle RAC是采用共享磁盘方式实现数据库的群集。群集环境中所有节点共享且并发地对磁盘上的数据库进行更新,另外还要额外地需要同其它节点进行同步和串行机制,以避免两个或多个节点同时更新同一数据页上的记录,那么Oracle RAC是如何利用缓存融合处理数据同步的?
1、节点A读取一个全新的数据块,该数据块没有被任何节点读入
1)节点A的请求发给GCS,GCS把这个请求转发给这个数据块的主节点,这里假定是节点B。因为这个数据块没有在任何节点的内存中,GCS标记这个数据块状态为S(shared,共享状态),并记录到GRD中。
2)接着B告诉节点A状态修改了,准备工作都完成了。然后节点A记录共享状态在自己的实例中,并读入该数据块。这时,节点A持有了该数据块,并在GRD中进行记录,标记持有该数据块。此时,整个过程发生了一次IO操作,也就是单块读。
如果是多个数据块同时读那就是多快读(一般是全表扫描),类似会产生多次IO操作。
2、节点C要修改刚才节点A读入的数据块,这里假定节点A刚才读入的数据块SCN是100。
1)节点C找到该数据块的主节点,也就是节点B,要求能加一个X标记(exclusive,独占状态),表明要修改数据。但是这个数据块可能已经存在于多个节点的实例中,每个实例都有个S标记。
2)GCS会告诉所有持有该数据块的实例,把状态S标记转换为N标记(null,空状态)。
3)最后一个从S标记转换为N标记的实例把数据块发送到需要对其进行修改的节点如节点C上。
4)这时节点C的实例就可以对该数据块加上X标记,并通知该数据块的主节点,也就是节点B的GCS,GCS将最新的标记与位置记录到GRD,并关闭以前节点的资源记录。这时节点C就可以修改该数据块了,假定把SCN从100修改成了101,这个时候磁盘上的数据块SCN还是100,整个过程是通过内部互联进行数据交换,没有磁盘IO产生。
3、节点D也要修改该数据块
1)与节点C修改该数据块类似,节点D也会找到该数据块的主节点,也就是节点B,要求加一个X(exclusive,独占状态)的锁,表示要修改该数据块。
2)这时GCS会告诉上一次修改成功的节点C,放弃它加上的X标记,因为别的节点也要修改这个数据块。
3)节点C会确保这个数据块的改变,已经记入联机日志中,然后转换X标记为N标记,并把这个数据块拷贝到节点D。
4)节点D加上X标记,并通知该数据块的主节点,也就是节点B的GCS,GCS将最新的标记与位置揭露到GRD,并关闭以前节点上的资源记录。这时节点D就可以修改该数据块了,假定把该数据块的SCN从101又修改成102,但是磁盘的数据块上的SCN还是100。可以发现RAC在这个过程中,也没有任何磁盘操作,同样是通过内部互联来完成的。
4、节点A要重新读取该数据块
1)节点A还是一样,首先找到该数据块的主节点,也就是节点B,希望能读取最新的数据块,也就是SCN为102的内容。
2)GCS根据GRD得知最新的数据块在节点D上,于是GCS通知节点D。节点D需要确保刚才修改过的数据块已经记录在联机日志中,如果已经确定记录过,则把原来的X标记转换为S标记。
3)节点D拷贝数据块到节点A的实例,这时节点A获得该数据块,并获得S标记。
4)最后再告诉该数据块的主节点,也就是节点B,GCS记录最新的标记与位置到GRD,这个时候,节点A与节点D同时持有S标记的相同的数据块,数据块的SCN为102,但是磁盘中的数据块SCN还是100,最后如果发生写操作,只要最新的一个节点发生写操作即可,所以该数据块虽然在不同节点、不同实例中发生了多次改变,最终却只有一次写IO操作
这里还是有一些问题需要思考的:
1、在所有实例都未读取该块,而第一个实例读取时,是怎么加的锁,加的什么锁?如果此时有另一个实例也要读这个块,几乎是同时的,那么 Oracle 如何来仲裁,如何让其中一个读取,而另一个再从前者的缓存中通过 cache 来得到?
2、如果一个块已经被其他实例读入,那么本实例如何判断它的存在?
3、如果某个实例改变了这个数据块,是否会将改变传递到其他实例,或者说其他实例是否会知道并重新更新状态?
4、如果一个实例要 swapout 某个块,而同时其他实例也有这个块的缓存,修改过的和未修改过的,本实例修改的和其他实例修改的,如何操作? truncate 一张表,drop 一张表... 和单实例有何不同?
上面的问题大家也可以思考下,欢迎在下方留言一起探讨~
后面会分享更多DBA方面的内容,感兴趣的朋友可以关注下!!