RAC必须了解——DLM分布式锁的实现机制

lovejk

2018-11-25

概述

后面会讲下怎么去做rac，所以先讲下DLM分布式锁机制，RAC学习必须先了解的。

AST简介

DLM进程(LMON、LMD)之间的跨实例通信是使用高速互联上的IPC层实现的。为了传递锁资源的状态，DLM使用了异步陷阱(AST)，它在操作系统处理程序例程中实现为中断。纯粹主义者可能同意AST的确切含义以及它的实现方式(中断或其他阻塞机制)，但对于OPS或Oracle RAC来说，它就是中断。

AST可以是一个"阻塞AST"，也可以是一个"获取AST"。当一个进程请求一个资源上的锁时，DLM向当前对同一资源拥有锁的全部进程发出一个阻塞异步陷阱(BAST)。在可能和必要时，这个锁的拥有者会放弃这个锁，允许请求者获取对该资源的访问。DLM将向请求者发送一个获取AST(AAST)，通知其现在可以拥有这个资源(和这个锁)。通常将AAST看作进程的"唤醒呼叫"。

DLM使用两个队列跟踪所有的lock 请求，并用两个ASTs（asynchronous traps）来完成请求的发送和响应，实际就是异步中断（interrupt）或者陷阱（trap）。下图显示的是资源和队列的关系，granted queue中记录的是所有已经获得的lock的进程，而convert queue记录时是所有等待lock的进程。

RAC必须了解——DLM分布式锁的实现机制

DLM中资源的锁队列

进程1和进程2拥有数据块S模式的锁，因此在granted queue 中有记录，假设现在进程2要获得X模式的锁，进程2必须先向DLM提出请求；请求提交给DLM后，DLM就要把进程2放在convert queue中。向拥有不兼容模式锁的进程1发送一个blocking ASTs，这是一个异步请求，所以DLM不必等待响应。当进程1接受到这个BAST之后，就会把这个lock降级为null模式，DLM把进程2的锁模式转换为x模式，如下图所示：

RAC必须了解——DLM分布式锁的实现机制

BAST

然后，DLM发送一个acquisition ASTn（AAST）给进程2，并把进程2放到Granted queue中，如下图所示，进程2就可以继续处理了：

RAC必须了解——DLM分布式锁的实现机制

AAST

在DLM中如何授予锁

为了说明锁定在OPS的DLM中是如何工作的，请考虑一个由两个节点组成的示例集群，它有一个共享磁盘阵列：

(1) 进程p1需要修改实例1上的一个数据块。p1需要检查这个数据块上是否存在锁，然后才能将它读入实例1上的缓冲区缓存中。

(2) 这个数据块中可能存在锁，也可能不存在，因此LCK进程检查SGA结构，以验证缓冲区锁状态。如果存在锁，那么LCK必须请求DLM对这个锁进行降级。

(3) 如果不存在锁，那么LCK必须在本地实例中创建锁元素(LE)，其角色是本地的。

(4) LCK必须以独占模式向DLM请求这个LE。如果该资源由实例1主控，那么LM继续处理。否则，必须将这个请求发送到集群中的主控DLM。

(5) 假定这个锁由实例1主控，则这个实例上的DLM在其DLM数据库中进行本地缓存查询，发现实例2上的一个进程已经对同一数据块拥有独占(EX)锁。

(6) 实例1上的DLM向实例2上的DLM发出一个BAST，请求对此锁进行降级。实例2上的DLM向同一实例上的LCK发出另一个BAST，将这个锁由EX降级为NULL。

(7) 实例2上的进程可能已经更新了这个锁，并且可能还没有提交修改。"脏缓冲区写入器"(DBWR)得到信号，将这个数据块写到磁盘上。在写入确认之后，实例2上的LCK将这个锁降级为NULL，向同一实例上的DLM发送一个AAST。

(8) 实例2上的DLM针对锁状态的修改对本地DLM数据库进行更新，并向实例1上的DLM发送一个AAST。

(9) 实例1上的主控DLM更新主控DLM数据库中这个锁(EX)的状态，现在可以将这个锁授予其实例上的进程。DLM自身将这个锁升级到EX。

(10) 实例1上的DLM现在向本地LCK进程发送另一个AAST，向它通知有关锁授予的情况，而且现在可以从磁盘读取该数据块。

后面会分享下怎么去安装部署oracle12c RAC环境，感兴趣的朋友可以关注下~

RAC必须了解——DLM分布式锁的实现机制

rac 分布式锁

安科网

RAC必须了解——DLM分布式锁的实现机制

lovejk

概述

AST简介

在DLM中如何授予锁

lovejk

相关推荐

rac（二）

Oracle19c RAC+DG生产项目实战（RHEL8+云架构版）视频教程

Oracle 19c RAC 升级RU 从19.3 升级到19.6 操作手册（使用nonrolling 方式）

Oracle RAC 12.2.0.1打补丁Patch 30920127(Apr 2020)

Cenots7.6 安装Oracle Rac 11.2.0.4

oracle 11.2.0.3 rac集群rman周备份策略

srvctl commands in Oracle RAC 11g

Oracle 给rac创建单实例dg并做主从切换功能

ORACLE RAC 的启动和关闭顺序

RHEL6.6安装Oracle 11g RAC - 基于VMware的实验环境

oracle rac 添加SCAN IP

Oracle12c RAC RMAN异机恢复

Oracle - 给rac创建单实例dg，并做主从切换

How to deploy Oracle 12c Release 2 Grid and RAC Database on RHEL 7.x

GitHub: Oracle RAC Database on Docker 未测试改天试试

数据库集群方案及Oracle RAC架构分析

深度挖掘 ORACLE RAC 数据库架构分析与实战攻略.pdf 免费下载

Oracle RAC业务bug导致部分数据丢失处理

安装Oracle 11g RAC时报Failed to run “oifcfg” 和找不到集群

Oracle RAC for aix 存储双控锁盘导致ASM控制文件损坏恢复实例

lovejk