Zabbix监控磁盘IO状态详解

#  软件介绍 iostat
# 使用iostat 需先安装sysstat软件包, 系统包中有带

# 系统: CentOS,rh 6-7都可以
  zabbix版本: 3.0 3.2 可以 其它版本没有试过

# iostat用于输出CPU和磁盘I/O相关统计信息

# iostat可以显示CPU和I/O系统的负载情况及分区状态信息.
直接执行iostat可以显示下面内容:

[wmt@template ~]$ iostat
Linux 2.6.32-358.el6.x86_64 (template.xx.xx) 07/14/2017 _x86_64_(32 CPU)

avg-cpu:  %user  %nice %system %iowait  %steal  %idle
          2.93    0.00    0.20    0.04    0.00  96.83

Device:            tps  Blk_read/s  Blk_wrtn/s  Blk_read  Blk_wrtn
sda              0.66        6.60        14.79  462593198 1036802588
sdc              0.20        1.60        0.00  112173840          0
sdb              25.46      453.65      582.45 31805540026 40835922808
scd0              0.00        0.00        0.00      5012          0
dm-0            25.21      453.64      582.45 31805251514 40835922808
dm-1              1.89        6.35        14.55  445409130 1020026016
dm-2              0.06        0.24        0.24  17154880  16776296

# cpu段配置说明
avg-cpu
%user: 用户空间使用CPU百分比
%nice : nice使用
%system : 系统(kernel)使用cpu百分比
%iowait : cpu等待硬盘I/O时,所占用的百分比
%steal  : 系统偷出CPU的百分比 (不知道什么鬼,求解释)
%idle: 系统空闲百分比

# Device磁盘段配置说明
tps: 每秒钟发送到I/O请求数
Blk_read/s: 每秒从磁盘读出的的数据量,单位B
Blk_wrtn/s: 每秒从磁盘写入的的数据量,单位B
Blk_read: 开机始从磁盘读出的数据总量
Blk_wrtn: 开机始从磁盘写入的数据总量

# 命令使用
  iostat 1  # 每秒刷新一次
  iostat -k  # 以KB为单位 默认B
  iostat -m  # 以MB为单位
  iostat -v  # 显示版本号
  iostat -c  # 仅显示CPU
  iostat -d  # 仅显示磁盘

##################  dm设备监控大概思路    ##################################

#查看dm对应设备号是哪一个
[root@template ~]# dmsetup ls
mpathb(253:0)
vg_sys-LogVol01(253:1)
vg_sys-LogVol00(253:2)

# 找到设备号对应信息
[root@template ~]# ll /dev/mapper/
total 0
crw-rw----. 1 root root 10, 58 Apr 25  2015 control
lrwxrwxrwx. 1 root root      7 Apr 25  2015 mpathb -> ../dm-0
lrwxrwxrwx. 1 root root      7 Apr 25  2015 vg_sys-LogVol00 -> ../dm-2
lrwxrwxrwx. 1 root root      7 Apr 25  2015 vg_sys-LogVol01 -> ../dm-1

# 再检查设备挂载目录,比如swap就可不用监控,一般也不会往里写入数据
[root@template ~]# cat /etc/fstab
#
# /etc/fstab
# Created by anaconda on Sat Apr 25 01:09:22 2015
#
/dev/mapper/vg_sys-LogVol01 /                      ext4    defaults        1 1
/dev/mapper/vg_sys-LogVol00 swap                    swap    defaults        0 0
/dev/mapper/mpathb/homeext4defaults1 0

##################### zabbix 配置  #####################

###############  在需要监控的机器中增加这个脚本 #########################
# 计划脚本文件
1 <BR>

################ 配置配合 计划任务每20秒更新一次 ###################
#!/bin/bash
#
#  Name:iostat 只升不降,取出iostst最新io写入写出
#  Version Number:1.01
#  Type:服务启动脚本
#  Language:bash shell 
#  Date:2017-07-17
#  Author:xiong

# 每隔多少秒刷新一次iostat,默认的那个值只降不升 
iostat -xdtk 5 3 > /tmp/iostst_temp.txt

# 取出现在时间
times=`date  "+%Y"年0"%h%d"日" %H"时"%M"分"%S"秒""`

# 取出最后一次iostat更新的数据,为最新数据,将最新的数据更新至/tmp/2.txt 不输出
grep "$times" -A 100 /tmp/iostst_temp.txt  > /tmp/iostst_temp2.txt

# 时间格式: 07/17/2017 03:03:06 PM
# times=`date "+%D %r"` 
#
# 时间格式: 2017年07月17日 15时01分03秒
# times=`date  "+%Y"年0"%h%d"日" %H"时"%M"分"%S"秒""`

# 计划任务:每一分钟执行一次
*/1 * * * * /bin/bash /usr/local/zabbix/script/iostate.sh

# 内容导出如下
Device:        rrqm/s  wrqm/s    r/s    w/s    rkB/s    wkB/s avgrq-sz avgqu-sz  await r_await w_await  svctm  %util
sda              0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00    0.00  0.00  0.00

#  配置介绍
rrqm/s: 每秒进行 merge 的读操作数目。即 rmerge/s
wrqm/s: 每秒进行 merge 的写操作数目。即 wmerge/s
r/s: 每秒完成的读 I/O 设备次数。即 rio/s
w/s: 每秒完成的写 I/O 设备次数。即 wio/s
rsec/s: 每秒读扇区数。即 rsect/s
wsec/s: 每秒写扇区数。即 wsect/s
rkB/s: 每秒读K字节数。是 rsect/s 的一半,因为每扇区大小为512字节。
wkB/s: 每秒写K字节数。是 wsect/s 的一半。
avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区)。
avgqu-sz: 平均I/O队列长度。
await: 平均每次设备I/O操作的等待时间 (毫秒)。
svctm: 平均每次设备I/O操作的服务时间 (毫秒)。
%util: 一秒中有百分之多少的时间用于 I/O 操作,即被io消耗的cpu百分比

# 在zabbix_agent中增加一个脚本
#############################  zabbix脚本 ###########################
#!/bin/bash
#
disk=$1
case $2 in
rrqm)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $2}' ;;
wrqm)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $3}' ;;
read)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $4}' ;;
wirte)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $5}' ;;
readin)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $6}' ;;
wirtein)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $7}' ;;
avgrqsz)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $8}' ;;
avgqusz)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $9}' ;;
await)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $10}' ;;
rawait)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $11}' ;;
wawait)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $12}' ;;
svctm)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $13}' ;;
util)
        grep "$disk" /tmp/iostst_temp2.txt | awk '{print $14}' ;;
*)
        echo "使用方法  /bash disk_name $2"
        exit 5 ;;
esac

# 最后需要配置文件中在zabbix_agentd.conf中增加这行
UserParameter=sys.io[*],/usr/local/zabbix/script/system_io.sh $1 $2

# 在服务器端测试是脚本是否可以
[root@zabbixd bin]# zabbix_get -s ipaddress -p port -k sys.io[sdb,wawait]
0.0
[root@zabbixd bin]# zabbix_get -s ipaddress -p port -k sys.io[sdb,wrtn]
0.0

# 可能会报权限错误,需要增加权限 chmod +x /bin/bash /usr/local/zabbix/script/iostate.sh
#    以及在增加属主属组权限  chown zabbix.zabbix !$

#  模板如下,自动发现需要定义API,不太熟,练习中,有多个磁盘需要监控的话,直接将模板导出,然后将模板名称更换一下需要的,然后在导入就行了,模板如下:

#  模板请直接下载附件

#最后在加上一个效果图
Zabbix监控磁盘IO状态详解

相关推荐