详解Oracle实例囚笼--限制数据库实例使用的CPU资源

概述

当多个实例运行在同一台服务器上时,为了避免实例间的相互影响,从oracle 11gr2开始推出了实例囚笼的概念。实例囚笼能够限制数据库实例使用的CPU资源。使用实例囚笼,只需要设置CPU_COUT和resource_manager_plan两个参数。该功能可以用于的数据库资源整合,而取代之前的虚拟化和分区等传统的资源分割方法。

详解Oracle实例囚笼--限制数据库实例使用的CPU资源


1、查看服务器的CPU个数

select value from v$osstat where stat_name = 'NUM_CPUS';

2、开启Instance Caging,只需设置两个参数即可

alter system set cpu_count = 8;
alter system set resource_manager_plan = 'default_plan';

详解Oracle实例囚笼--限制数据库实例使用的CPU资源


3、验证功能已经启用

SQL> select instance_caging from v$rsrc_plan where is_top_plan = 'TRUE';
SQL> show parameter cpu_count;

详解Oracle实例囚笼--限制数据库实例使用的CPU资源


4、查看功能使用情况

SQL> select to_char(begin_time, 'HH24:MI') time, sum(avg_running_sessions) avg_running_sessions, sum(avg_waiting_sessions) avg_waiting_sessions from v$rsrcmgrmetric_history group by begin_time order by begin_time;
TIME AVG_RUNNING_SESSIONS AVG_WAITING_SESSIONS
----- -------------------- --------------------
14:48 .82905 .000083333
14:49 .536 .40295
14:50 .334233333 .060016667
17:30 8.53193333 4.39328333
17:31 15.85885 .0001
17:32 9.46965 22.3486667

avg_running_sessions是一分钟内的活动sessions数,如果次数远小于CPU_COUNT,这实例远没有达到限制。如果AVG_WAITING_SESSIONS很大,这系统基本达到最大限制了


5、可以动态的调整CPU_COUNT来调整实例使用的资源。下面是测试结果

a, 设置cpu_count为32,即不设置限制。

SQL> alter system set cpu_count =32;

开始压力测试,PC服务器的TPMC达到45万TPMC,CPU利用率75%左右

09:44:17 all 69.73 0.00 5.65 2.83 0.00 21.79
09:44:27 all 71.52 0.00 5.81 2.69 0.00 19.99
09:44:37 all 61.98 0.00 5.12 2.91 0.00 29.99
09:44:47 all 69.76 0.00 5.66 3.58 0.00 21.00

b, 设置实例囚笼功能,即限制CPU_cout为16,数据库出现大量resmgr:cpu quantum等待事件(这个和资源管理有关),此时系统利用率65%左右,但%user为50%左右,即16个cpu.TPMC为20万。能力受到限制

SQL> alter system set cpu_count=16;
09:49:28 CPU %user %nice %system %iowait %steal %idle
09:49:38 all 53.91 0.00 8.78 1.81 0.00 35.50
09:49:48 all 52.15 0.00 8.66 2.88 0.00 36.31
09:49:58 all 53.91 0.00 8.37 1.85 0.00 35.87
09:50:08 all 50.98 0.00 8.76 2.66 0.00 37.60
09:50:18 all 53.24 0.00 8.42 1.91 0.00 36.43

c, cpu_count=8;%User为27%,基本保持在8个CPU数量,TPMC 10万左右

09:57:38 CPU %user %nice %system %iowait %steal %idle
09:57:48 all 27.96 0.00 4.99 3.01 0.00 64.03
09:57:58 all 27.82 0.00 4.47 2.49 0.00 65.21
09:58:08 all 27.97 0.00 4.54 2.31 0.00 65.18
09:58:18 all 27.90 0.00 4.50 2.25 0.00 65.34

d,查看动态视图avg_running_sessions和cpu_count基本一致,说明已经达到最大限度了

SQL> select to_char(begin_time, 'HH24:MI') time, sum(avg_running_sessions) avg_running_sessions, sum(avg_waiting_sessions) avg_waiting_sessions from v$rsrcmgrmetric_history group by begin_time order by begin_time;
09:44 18.4489333 .017666667
09:45 14.9326833 34.1877333
09:46 14.5135167 44.6346167
09:47 13.7069167 41.3688333
09:48 14.3363833 43.9001667
09:49 14.3411 43.345
09:50 14.2703333 43.2445
09:51 8.04406667 58.9471667
09:52 1.86445 15.7961833
09:53 7.1256 62.3546667
09:54 7.32335 64.64055
09:55 7.30835 64.3774
09:56 7.2753 64.0636333
09:57 7.35958333 65.0054
09:58 7.23883333 64.4193333
09:59 7.06161667 62.3264833
10:00 7.3477 66.1179333
10:01 7.3673 66.7519
10:02 5.44061667 48.0556167
10:03 .009183333 0
10:04 .006833333 0
10:05 .00545 0
10:06 .0062 0
10:07 1.5357 12.9266833
10:08 7.35653333 65.4692333
10:09 7.36343333 65.6357833
10:10 7.1894 63.24075

设置instance caging

参数CPU_COUNT指定了Oracle实例可以同时使用的CPU的数量,数据库的部分功能配置依赖于CPU_COUNT参数,比如查询优化器,并行查询和资源管理器。

Instance caging是Oracle Database 11gR2企业版的新特性,是对CPU资源使用的一个简单管理方法. 如果要启动Instance caging,需要为数据库实例设置CPU_COUNT参数和启动一个资源管理计划。

通常有两种方法来设置instance caging:

  • Partitioning:
  • 在这种方法中,所有实例的CPU_COUNT的总和小于或等于系统的CPU数目,实例之间互不干扰。
  • Over-provisioning:
  • 在这种方法中, 所有实例的CPU_COUNT的总和超过系统的CPU数目,实例的性能会相互影响。

1. CPU_COUNT参数的默认值是系统上最大可用的CPU数量

SQL> show parameter cpu_count
NAME TYPE VALUE
------------------------------------ ----------- ------------------------------
cpu_count integer 64

通过alter system限定实例可用的CPU数量

SQL> alter system set cpu_count=2;

2. 可以设置自己的资源管理计划,在CPU指令中使用mgmt_p1,mgmt_p2,...,mgmt_p8来限定消费者组的CPU资源利用率。

最简单的方法是启动默认的DEFAULT_PLAN.

SQL> alter system set resource_manager_plan=DEFAULT_PLAN;

在11gR2中,还不能为数据库实例指定特定的CPU,同一系统上的不同实例的进程可能会运行在相同的CPU上。


后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注一下~

详解Oracle实例囚笼--限制数据库实例使用的CPU资源

相关推荐