Oracle RAC系统内存无法释放解决
交代一下环境,是现网实时生产数据库主机。Hp-ux 11.31+Oracle 10.2.0.4.0 RAC集群。
两台机器户外RAC,essdb3与essdb4两台机器。
物理内存128G,SGA分配64G,PGA分配5G。早上发现essdb4主机glance运行只有6G的空闲内存。
使用如下命令进行简单分析:
SQL> select distinct sid from v$mystat; 得到sid,算算一个空闲进程占用的pga有多大。
SQL>select b.PGA_USED_MEM PGA_USED_MEM, b.PGA_ALLOC_MEM PGA_ALLOC_MEM,b.PGA_FREEABLE_MEM PGA_FREEABLE_MEM,b.PGA_MAX_MEM PGA_MAX_MEM from v$session a, v$process b where a.PADDR=b.ADDR and a.sid ='&sid'
输入刚刚得到的SID号。算出一个空闲进程大概占用的内存,系统总的PGA的使用基本上稳定在1.29G到2G之间(系统设置的PGA的最大值是5G),与往常相比也是一个非常合理的状态。
SQL> select sum(PGA_USED_MEM) from v$process;
SUM(PGA_USED_MEM)
-----------------
1298679359
我们使用ipcs观察共享内存段的使用情况:
essdb4_oracle[/var/adm/syslog]$ipcs -mb
IPC status from /dev/kmem as of Thu Jun 23 10:18:00 2016
T ID KEY MODE OWNER GROUP SEGSZ
Shared Memory:
m 0 0x411c06cb --rw-rw-rw- root root 348
m 1 0x4e0c0002 --rw-rw-rw- root root 61760
m 2 0x4120077b --rw-rw-rw- root root 8192
m 3 0x00a5c581 --rw------- sfmdb users 10469376
m 4 0x411c14fb --rw------- root root 4096
m 13893637 0x00000000 --rw-r----- oracle oinstall 18790481920
m 6 0x06347849 --rw-rw-rw- root root 65544
m 7 0x0c6629c9 --rw-r----- root root 22614264
m 32776 0x01205c0a --rw-rw-r-- root root 4192
m 9 0x00000000 D-rw-rw-r-- root root 4192
m 10 0x00000000 D-rw-rw-r-- root root 4192
m 11 0x4918a061 --rw-r--r-- root root 22912
m 12 0x0120468b --rw-rw-r-- root root 4192
m 13 0x00000000 --rw-r----- oracle oinstall 18807521280
m 14 0x00000000 --rw-r----- oracle oinstall 18807259136
m 15 0x00000000 --rw-r----- oracle oinstall 12367142912
m 16 0x3546761c --rw-r----- oracle oinstall 135168
共享内存的详细使用信息:
essdb4_oracle[/]#ipcs -mb
IPC status from /dev/kmem as of Thu Jun 23 13:42:57 2016
T ID KEY MODE OWNER GROUP SEGSZ
Shared Memory:
m 0 0x411c06cb --rw-rw-rw- root root 348
m 1 0x4e0c0002 --rw-rw-rw- root root 61760
m 2 0x4120077b --rw-rw-rw- root root 8192
m 3 0x00a5c581 --rw------- sfmdb users 10469376
m 4 0x411c14fb --rw------- root root 4096
m 13893637 0x00000000 D-rw-r----- oracle oinstall 18790481920
m 6 0x06347849 --rw-rw-rw- root root 65544
m 7 0x0c6629c9 --rw-r----- root root 22614264
m 32776 0x01205c0a --rw-rw-r-- root root 4192
m 9 0x00000000 D-rw-rw-r-- root root 4192
m 10 0x00000000 D-rw-rw-r-- root root 4192
m 11 0x4918a061 --rw-r--r-- root root 22912
m 12 0x0120468b --rw-rw-r-- root root 4192
m 13 0x00000000 --rw-r----- oracle oinstall 18807521280
m 14 0x00000000 --rw-r----- oracle oinstall 18807259136
m 15 0x00000000 --rw-r----- oracle oinstall 12367142912
m 16 0x3546761c --rw-r----- oracle oinstall 135168
共享内存段状态为D - Delete,这在通常情况下是不正常的,这是一个Oracle用户占用的共享内存段,由于状态为D的共享内存段本身就是没有正常使用的内存段,所以满以为使用ipcrm –m id删除这个共享内存段,应该就可以解决问题,但是,当时上述做法的结果是系统报告找不到找个ID。
essdb4_oracle[/]#ipcrm -m 13893637
现在我们使用shminfo要使用root权限,查看一下当前到底哪个进程在使用找个共享内存段:
essdb4_oracle[/]#shminfo -s 13893637
sh: shminfo: not found.
最后重启该节点数据库依然持有该共享内存,无果最后只能重启操作系统,得到释放,当前系统可用内存40G。