Linux服务器问题排查思路及常用命令

作为一名合格的开发人员,特别是做后端的同学,经常会遇到各种各样的问题。

Linux服务器问题排查思路及常用命令

内存问题

free命令用于查看内存的使用情况,在Linux上,很多人会用top显示系统内存,但是不够直观,top通常我们用于查看CPU的占用率。Linux下查看内容的专用工具是free命令。

Linux服务器问题排查思路及常用命令

各项指标的意义如下:

  • total:总表示物理内存的大小;
  • used:已使用的内存大小;
  • free:可用内存大小;
  • shared:多个进程共享的内存总额;
  • buff/cached:磁盘缓存的大小;
  • available:应用程序能使用的物理内存大小。

free与available的区别

free是真实未被使用的物理内存大小,而available是应用程序可用内存大小

available ≈ free + buffer + cache 

CPU问题

除了用top命令,我们还可以使用更为直观的pidstat命令

Linux服务器问题排查思路及常用命令

一般我们关注PID和%CPU两项指标即可。

磁盘IO异常问题

iotop命令可以用于查看正在写磁盘的进程ID信息,它可以帮助我们找到导致磁盘IO异常的进程。

Linux服务器问题排查思路及常用命令

如果各项指标都很低,那么则可能是系统磁盘问题,可以用dmesg命令查看系统信息:

Linux服务器问题排查思路及常用命令

如果是磁盘写满了,按照以下思路找到对应的文件并删除

1.找出最大的五个目录

du -hm / --max-depth=1 | sort -nr | head -5 

2.找出当前目录下大于1G的文件

find . -type f -size +1000M 

3.假如找到nginx日志access.log,那么我们可能得清空对应的日志文件

echo "">access.log.log 

很多人的第一反应是用rm命令

rm -rf access.log 

虽然rm可以删除文件,但是有时空间不会被立即释放,比如该例子,nginx服务仍在运行,除非重启该服务。

查看压缩好的备份日志

bzgrep ‘192.168.1.100’ access-2020-04-06.log 

为什么要用bzgrep,因为如果解压后再查看会耗费很长的时间。

查看网站并发连接数

比如查看Nginx的并发连接情况,以便我们了解网站的负载情况。

执行以下命令:

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 

结果:

Linux服务器问题排查思路及常用命令

ESTABLISHED的数量就是当前并发连接数。

访问量统计

很多时候网站会遭遇恶意攻击,我们需要找到出问题的IP进行封杀。

查询访问最频繁的IP

awk '{print $1}' access-2020-04-06.log | sort | uniq -c | sort -n -k 1 -r | more 

其他需求

相关推荐