基于Nginx的负载均衡概述与实现

yyanglinyu

2017-03-19

前言：

前面我们提到了LVS和Keepalived结合起来的高可用负载均衡，LVS根据原目ip地址及端口将其调度转发至后端的某个主机，是一种四层的实现，因为LVS是四层的，所以不会受限于套接字或打开的文件数量。不过，如果我们想实现一些更高阶的功能，LVS就显得力不从心了，比如基于uri，cookie，header头部信息的负载均衡，此时我们就可以选择一些7层的负载均衡实现，比如Nginx或haproxy等。本次我们就先来讲讲Nginx的负载均衡。

LVS http://www.linuxidc.com/Linux/2017-03/141927.htm
Keepalived http://www.linuxidc.com/Linux/2017-03/141929.htm

正文：

其实，如果对LVS的各种类型和调度有清晰的认识，那么理解Nginx的负载均衡并没有什么难度，无非就是监听前端server的ip和端口，并指定后端可调用的服务器地址就好~虽然Nginx也有健康检测机制，但是只有在Nginx plus中才能能使用。不过如果后端服务的端口不存在Nginx倒也不会向其调用请求啦~那我们来具体说说。

uostream

ngin的负载均衡得用到upstream模块，它用来定义一个后端服务器组，即把所有后端的服务器整合在一起，然后通过proxy代理到这个服务器组。就能实现简单的http负载均衡了，upstream默认的调度方式是wrr(具体内容可参考LVS中的介绍)，所以我们只用指定服务器的ip，如果端口不是默认80端口也可以单独指定，还有一些调度用到的参数，比如权重。如果只是干巴巴的介绍也很抽象，我们就根据配置来介绍吧。

http｛
...
upstream backserver { #backserver是一个自定义的名字，后面会调用
server 172.16.53.101; #第一个后端server
server 172.16.53.102 ; #第二个后端server
}
...
server {
listen 80;
server_name xiaofengfeng.cn;
location / {
proxy_pass #代理到服务器组，此处只支持http/https
index index.html;
}
}
｝

上面就是一个最简单的基于nginx的服务均衡配置了。upstream 的server后面还可以加许多参数，比如设置不同的权值weight=number，权值越大调用的次数越多。backup参数可以设置backup server，比如我们可以设置本机为backup server，当后端服务器都不能访问的时候，我们本机可以提供一个sorry 页面。

http｛
...
upstream backserver {
server 172.16.53.101;
server 172.16.53.102 ;
server 127.0.0.1 backup;
#指定本机回环地址为备用server，此处我们提供一个sorry server
}
server {
listen 192.168.157.128:80; #代理服务只监听前端服务的ip和端口
server_name xiaofengfeng.cn;
location / {
proxy_pass http://backserver;
index index.html;
}
}
server {
listen 127.0.0.1:80; #回环地址用来做sorry server
server_name xiaofengfeng2.cn;
location / {
root /var/nginx;
index index.html;
}
}
}

注：因为我们改变了监听的ip所以得重启nginx服务，而不是用nginx -s reload。

除了server配置选项还有其他一些常用的，比如我们可以改变其调用算法为wlc，即least_conn，就会根据后端服务器的连接数来调用。如果我们的一些用户信息，比如说session，cookie等保存在后端服务器本地，为了放置用户信息丢失，我们可以让一个用户的请求都发送到同一个后端服务器。ip_hash就可以实现这样的功能。来自同一个源IP地址的请求始终发往同一个upstream server。除了根据源地址hash，我们还可以指定特定的参数来作为hash的条件，比如，如果我们用uri作为hash条件，那么同一个uri的请求会发往同一台后端服务器。此时我们就要用到hash选项，比如：

hash $request_uri consistent

$request_uri是内置提供的变量，就是请求的uri咯，consistent是一致性哈希算法，这个倒是可以说道说道。我们知道哈希就是无论输入什么值，都会得到一个固定长度的散列值，我们对不同的uri求散列值，如果后端服务器有6台服务器，然后给他们进行编号0-6，然后用求的散列值对6做取余运算，就一定会得到0-6中的一个值，然后把这个分配给对应编号的服务器。不过，这个算法有个问题，如果某个服务器挂掉，我们就得重新以5来做取余运算，然后重新把所有过程从来一遍。所以就出现了上面的一致性哈希算法，我们现在先不关注后端有几台服务器，我们把0到2的32次方减一这个多个数字分布在一个圆环上，就上钟表上的0-12一样，0的地方就是12.然后我们对后端每个服务器的ip地址做哈希计算，得到的值在和2的32次方做取余运算，那么后端的这些服务器一定会分布在这个圆环上的某个点处，然后我们在对hash选项指定的内容，此处是uri做hash计算，得到的值在和2的32次方取余，所以这些uri也会分布在这个圆环上。然后我们规定，在这个圆环上分布的服务器，负责响应它到它下一个服务器的区间上分布的请求。此时当后端的某台服务器挂掉时，只会影响这台服务器后面的URI请求，而不会影响其他服务器，只用把属于这台服务器的请求，给它上一台就好，我们画个图说明下。

基于Nginx的负载均衡概述与实现

我们用方块表示后端服务器经过哈希计算的分布情况，用红色的线表示不同uri请求的分布情况，服务器1只用负责1到2之间的uri请求，以此类推，5只用负责5到1之间的uri请求，如右图所示，假如2号服务器挂掉了，我们就把所有属于2号服务器的请求分配给1号服务器~好啦~这就是一致性哈希算法~~~很重要哟，许多地方都有用到。

除了支持web服务的负载均衡，nginx还支持其他服务的负载均衡，此时我们就得用到另外d的模块stream和stream_proxy_module。不过这两个模块必须得是1.9.13以上的版本~并且默认stream并没有加载。得在编译时加入--with-stream选项，不过如果我们用的是预编译的rpm包安装的话，默认是有这个的~以下是/etc/nginx/nginx.conf

user nginx;
worker_processes 1;

error_log /var/log/nginx/error.log warn;
pid /var/run/nginx.pid;

events {
worker_connections 1024;
}
stream {
upstream sshsrvs {
server 192.168.10.130:22;
server 192.168.10.131:22;
}

server {
listen 172.16.100.6:22202;
proxy_pass sshsrvs;
proxy_timeout 60s;
proxy_connect_timeout 10s;
}

}

我们启动或者重启nginx，然后我们就可以通过22202 访问后端的ssh服务了，mysql服务也类似~当然是轮询访问啦~和上面的web服务类似。

下面关于Nginx的文章您也可能喜欢，不妨参考下：

Nginx 的详细介绍：请点这里
Nginx 的下载地址：请点这里

负载均衡 nginx负载均衡配置

安科网

基于Nginx的负载均衡概述与实现

yyanglinyu

yyanglinyu

相关推荐

nginx实现负载均衡

nginx实现负载均衡，引入第三方fair

关于Nginx的正向代理与反向代理

Nginx -负载均衡配置

一篇文章让你搞懂 Nginx 的负载均衡

Nginx服务器之负载均衡策略（6种）

【从单体架构到分布式架构】（二）请求增多，单点变集群(1)：负载均衡

16.负载均衡的配置场景和调度算法

针对负载均衡集群中的session解决方案的总结

ASP.NET Core3.1 Ocelot负载均衡的实现

TCP接入层的负载均衡、高可用、扩展性架构

Kubernetns LB方案：无需云厂商的动态DNS和负载均衡

.Net Core + Nginx实现项目负载均衡的全步骤

双机热备和负载均衡的区别

Azure Application Gateway（一）对后端 Web App 进行负载均衡

nginx 负载均衡

对 AWS Google Azure 三家全球负载均衡的延迟情况做个评测

软件开发中的负载均衡

CDN简介

lvs-dr实现mysql负载均衡集群

yyanglinyu