详解Oracle实例囚笼--限制数据库实例使用的CPU资源
概述
当多个实例运行在同一台服务器上时,为了避免实例间的相互影响,从oracle 11gr2开始推出了实例囚笼的概念。实例囚笼能够限制数据库实例使用的CPU资源。使用实例囚笼,只需要设置CPU_COUT和resource_manager_plan两个参数。该功能可以用于的数据库资源整合,而取代之前的虚拟化和分区等传统的资源分割方法。
1、查看服务器的CPU个数
select value from v$osstat where stat_name = 'NUM_CPUS';
2、开启Instance Caging,只需设置两个参数即可
alter system set cpu_count = 8; alter system set resource_manager_plan = 'default_plan';
3、验证功能已经启用
SQL> select instance_caging from v$rsrc_plan where is_top_plan = 'TRUE'; SQL> show parameter cpu_count;
4、查看功能使用情况
SQL> select to_char(begin_time, 'HH24:MI') time, sum(avg_running_sessions) avg_running_sessions, sum(avg_waiting_sessions) avg_waiting_sessions from v$rsrcmgrmetric_history group by begin_time order by begin_time; TIME AVG_RUNNING_SESSIONS AVG_WAITING_SESSIONS ----- -------------------- -------------------- 14:48 .82905 .000083333 14:49 .536 .40295 14:50 .334233333 .060016667 17:30 8.53193333 4.39328333 17:31 15.85885 .0001 17:32 9.46965 22.3486667
avg_running_sessions是一分钟内的活动sessions数,如果次数远小于CPU_COUNT,这实例远没有达到限制。如果AVG_WAITING_SESSIONS很大,这系统基本达到最大限制了
5、可以动态的调整CPU_COUNT来调整实例使用的资源。下面是测试结果
a, 设置cpu_count为32,即不设置限制。
SQL> alter system set cpu_count =32;
开始压力测试,PC服务器的TPMC达到45万TPMC,CPU利用率75%左右
09:44:17 all 69.73 0.00 5.65 2.83 0.00 21.79 09:44:27 all 71.52 0.00 5.81 2.69 0.00 19.99 09:44:37 all 61.98 0.00 5.12 2.91 0.00 29.99 09:44:47 all 69.76 0.00 5.66 3.58 0.00 21.00
b, 设置实例囚笼功能,即限制CPU_cout为16,数据库出现大量resmgr:cpu quantum等待事件(这个和资源管理有关),此时系统利用率65%左右,但%user为50%左右,即16个cpu.TPMC为20万。能力受到限制
SQL> alter system set cpu_count=16; 09:49:28 CPU %user %nice %system %iowait %steal %idle 09:49:38 all 53.91 0.00 8.78 1.81 0.00 35.50 09:49:48 all 52.15 0.00 8.66 2.88 0.00 36.31 09:49:58 all 53.91 0.00 8.37 1.85 0.00 35.87 09:50:08 all 50.98 0.00 8.76 2.66 0.00 37.60 09:50:18 all 53.24 0.00 8.42 1.91 0.00 36.43
c, cpu_count=8;%User为27%,基本保持在8个CPU数量,TPMC 10万左右
09:57:38 CPU %user %nice %system %iowait %steal %idle 09:57:48 all 27.96 0.00 4.99 3.01 0.00 64.03 09:57:58 all 27.82 0.00 4.47 2.49 0.00 65.21 09:58:08 all 27.97 0.00 4.54 2.31 0.00 65.18 09:58:18 all 27.90 0.00 4.50 2.25 0.00 65.34
d,查看动态视图avg_running_sessions和cpu_count基本一致,说明已经达到最大限度了
SQL> select to_char(begin_time, 'HH24:MI') time, sum(avg_running_sessions) avg_running_sessions, sum(avg_waiting_sessions) avg_waiting_sessions from v$rsrcmgrmetric_history group by begin_time order by begin_time; 09:44 18.4489333 .017666667 09:45 14.9326833 34.1877333 09:46 14.5135167 44.6346167 09:47 13.7069167 41.3688333 09:48 14.3363833 43.9001667 09:49 14.3411 43.345 09:50 14.2703333 43.2445 09:51 8.04406667 58.9471667 09:52 1.86445 15.7961833 09:53 7.1256 62.3546667 09:54 7.32335 64.64055 09:55 7.30835 64.3774 09:56 7.2753 64.0636333 09:57 7.35958333 65.0054 09:58 7.23883333 64.4193333 09:59 7.06161667 62.3264833 10:00 7.3477 66.1179333 10:01 7.3673 66.7519 10:02 5.44061667 48.0556167 10:03 .009183333 0 10:04 .006833333 0 10:05 .00545 0 10:06 .0062 0 10:07 1.5357 12.9266833 10:08 7.35653333 65.4692333 10:09 7.36343333 65.6357833 10:10 7.1894 63.24075
设置instance caging
参数CPU_COUNT指定了Oracle实例可以同时使用的CPU的数量,数据库的部分功能配置依赖于CPU_COUNT参数,比如查询优化器,并行查询和资源管理器。
Instance caging是Oracle Database 11gR2企业版的新特性,是对CPU资源使用的一个简单管理方法. 如果要启动Instance caging,需要为数据库实例设置CPU_COUNT参数和启动一个资源管理计划。
通常有两种方法来设置instance caging:
- Partitioning:
- 在这种方法中,所有实例的CPU_COUNT的总和小于或等于系统的CPU数目,实例之间互不干扰。
- Over-provisioning:
- 在这种方法中, 所有实例的CPU_COUNT的总和超过系统的CPU数目,实例的性能会相互影响。
1. CPU_COUNT参数的默认值是系统上最大可用的CPU数量
SQL> show parameter cpu_count NAME TYPE VALUE ------------------------------------ ----------- ------------------------------ cpu_count integer 64
通过alter system限定实例可用的CPU数量
SQL> alter system set cpu_count=2;
2. 可以设置自己的资源管理计划,在CPU指令中使用mgmt_p1,mgmt_p2,...,mgmt_p8来限定消费者组的CPU资源利用率。
最简单的方法是启动默认的DEFAULT_PLAN.
SQL> alter system set resource_manager_plan=DEFAULT_PLAN;
在11gR2中,还不能为数据库实例指定特定的CPU,同一系统上的不同实例的进程可能会运行在相同的CPU上。
后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注一下~