Linux系统的服务器巡检怎么做?一个服务器的快速巡检思路,经典
最近收到一个工作要求,让我完成一个每天一次的Linux服务器巡检工作(服务器的版本为红帽6.4),不可以使用监控软件来操作。在这里,把我的巡检过程和巡检脚本放送给大家做一参考。
首先,巡检内容可以参考下表:
Linux服务器应用巡检
具体的巡检内容在这里做一说明:
1、 CPU占用率
检查脚本:top shift+m c
这里需要记录的参数是?%us,建议稍等几秒看下动态变化再记录。
cpu占用率
2、内存使用率
检查脚本:free-m /free -g
内存使用率
这里重点需要看的是swap内存是否被使用了,需要记录的是第二行的第二个,它和总内存量的比值就是内存的使用率。具体使用-m还是-g,就看服务器内存大小了
3、硬盘使用率
检查脚本:df
硬盘使用率
磁盘使用率看的就是磁盘使用率本身了,这里如果服务器下的应用单独使用了挂载的磁盘,还需要单独查看挂载磁盘的使用率
4、 I/O空闲
检查脚本:iostat -xm
I/O空闲
需要记录的值就是图中红色框住的,?%idle,这个就是I/O空闲 。这里可以使用iostat -xm 1,动态查看多个值了之后取一个比较平均的。
5、应用运行状况
查看应用的页面是否正常,用户是否使用正常。
6、应用服务状态
检查脚本:./应用服务 status
查看是否服务状态为running。
7、应用服务运行日志是否有报错
检查脚本:cat 应用服务运行日志| grep ERR
直观查看应用服务运行的日志中是否有报错,这里也可以直接打开查看:
vim 应用服务运行日志
然后用“/ERR”查看报错
8、应用内容记录日志是否有报错
检查脚本:cat 应用内容记录日志 grep ERR
9、数据文件大小
首先,打开应用数据文件所在的目录,然后运行:du -sh *
这里可以看到此目录下所有文件的大小。
10、归档文件状态
这个是我负责的应用的一个特殊功能,可以归档,所有有这个需求,大家可以忽略。
11、备份执行情况