详解Oracle RAC 的“HA”和“LB”及如何用脚本测试负载均衡

wofangfan

2019-07-08

概述

今天主要介绍一下ORACLE RAC的“HA”和“LB”概念，以及分享一个脚本测试一下RAC是否两个节点有平均负载到。

1、相关概念

HA:High Availiablity 高可用
LB:Load balance 负载均衡，把负载均衡的分配到集群中的各个节点，从而提供整体的吞吐能力。

可用性是指一个系统可用时间的比率。

一般使用“平均故障间隔时间（MTTF）” 和 “平均故障修复时间（MTTR）”作为评价可用的度量标准。

公式：

可用性=MTTF/(MTTF+MTTR)

如果一个服务器连续运行6个月出现了一次故障，修复使用了20分钟，那么可用性为：

6个月/（6个月+20分钟）*100=99.92%

2、Rac（Real application cluster）

详解Oracle RAC 的“HA”和“LB”及如何用脚本测试负载均衡

2.1、Failover（故障转移）

Rac的高可用技术基础是Failover，就是指集群中任何一个节点的故障都不会影响用户使用，可以最大程度的解决单节点的故障，接到故障节点的用户会被自动转移到健康节点，用户感知不到这种故障切换。

2.2、SCAN（single client access name）

SCAN-VIP是oracle 11gR2引入的一个非常重要的特性，通过它可以实现负载均衡的连接到数据库实例，scan提供统一的名称来访问集群，不需要像10g那种在每个访问数据库的客户端配置多个vip地址实现负载均衡。

添加和删除节点的情况下也不需要对客户端做任何配置修改，就可以实现所有节点的负载均衡。

PS：SCAN只能实现负载均衡，自动Failover，需要使用service服务。

3、监听及TAF

3.1、监听

本地监听：公有IP和VIP
SCAN监听：SCAN VIP

3.2、TAF（Transparent Application Faiover）透明应用程序故障转移

大部分的应用系统（例如Tomcat）都是启动时就建立若干到数据库的长连接，在应用程序调整生命周期内重用这些链接。未提交事务会回滚。

链接建立以后，应用系统运行过程中，如果某个实例发生故障，链接到这个实例上的用户会被自动迁移到其他的健康实例上。

JDBC不支持TAF。

分为：

client-side TAF（10g用的较多）
server-sid TAF（11g常用）

4、测试服务端的TAF

1、使用TAF服务名/scan_ip进行连接

2、查看当前连接的实例是哪个（例如：rtbrac1）

3、查询select instance_name from v$instance

4、直接shutdown -h now rtbrac1所在的服务器

5、sqlplus端不用执行exit退出，再次执行select instance_name from v$instance，如果等会儿有返回，说明已经可以自动进行failover切换。

6、查看当前scanip在哪个节点（应该漂移到健康节点）

5、脚本测试TAF服务端的负载均衡

1、shell执行脚本（taf_load.sh）

#!/bin/sh
count=0
while [ $count -lt $1 ]
do
 count=`expr $count + 1`
 sqlplus -s glogowner/[email protected]:1521/otmdb @/home/oracle/scripts/test.sql
done

2、SQL执行脚本（test.sql）

col instance_name format a20
select instance_name from v$instance
/
exit;

详解Oracle RAC 的“HA”和“LB”及如何用脚本测试负载均衡

3、执行taf_load.sh（./taf_load.sh 1000 >> taf_load.log）

查看log对比两个实力的连接负载情况

[oracle@RFDB1 scripts]$ ./taf_load.sh 1000 &gt;&gt; taf_load.log
[oracle@RFDB1 scripts]$ cat taf_load.log |grep "RFDB1" |wc -l
634
[oracle@RFDB1 scripts]$ cat taf_load.log |grep "RFDB2" |wc -l
366

详解Oracle RAC 的“HA”和“LB”及如何用脚本测试负载均衡