Nginx负载均衡引起的网站不可用

最近碰到一个问题,手上有套架构的 nginx+lighttpd+ruby的网站,总是间断性的报不可用,按照常理来说,前端两台nginx做负载均衡,后面两台apache+resin应用,都做了很好的监控,如果服务挂掉了。首先肯定会不间断的报警,另外,不可能两台都挂了吧。而且是间隔性的,挂了立马就好了,这样的机率也非常小。 仔细想想,应该是前几天发布新版本后,才出现了这样的问题,决定仔细找一下问题原因,这样每天有个几分钟的不可用,也是挺让人苦恼的。

一,先从应用入手,查看lighttpd的应用日志。

A  lighttpd+ruby 服务器,发现有好多500错误,除了500的,其他也正常,和项目组沟通,这些500错误,全是蜘蛛抓的。而且我们没有这些链接, 对网站不影响,

Nginx负载均衡引起的网站不可用

第二台 lighttpd+ruby 服务器也是,都有很多500错误。

Nginx负载均衡引起的网站不可用

后端两台,如果排除这些500错误,应该没什么太大的问题。

相关推荐