nginx网站性能优化篇3反向代理实现负载均衡

239次阅读

共计 1931 个字符,预计需要花费 5 分钟才能阅读完成。

注意, 本篇文章为负载均衡的理论篇, 后续找个机会推出实战篇。理论篇主要讲述如何配置负载均衡, 配置负载均衡不难。但实战中要要注意几个点, 比如如何做到多服务器之间的数据共享(session,file 等), 多 cache 服务器如何做到命中率高等等问题

上一篇文章中我们通过反向代理了后端一台服务器,但随着网站访问的人越来越多一台服务器实在是顶不住,于是我们加了多台服务器,那么多台服务器又怎么配置代理呢?

upstream test.com{
# ip_hash;
server 192.168.10.13:80;
server 192.168.10.14:80  down;
server 192.168.10.15:8009  max_fails=3  fail_timeout=20s;
server 192.168.10.16:8080;
}
server {
  location / {proxy_pass  http://test.com;}
}

实际上负载均衡也是通过反向代理的方式, 但是 proxy_pass 只能写一个地址, 所以我们把某些地址通过 upstream 作为一个集合来做反向代理就实现了负载均衡;

upstream 负载均衡模块说明

upstream 是 Nginx 的 HTTP Upstream 模块,这个模块通过一个简单的调度算法来实现客户端 IP 到后端服务器的负载均衡。在上面的设定中,通过 upstream 指令指定了一个负载均衡器的名称 test.com。这个名称可以任意指定,在后面需要用到的地方直接调用即可。

支持的负载均衡算法

Nginx 的负载均衡模块目前支持 4 种调度算法,下面进行分别介绍,其中后两项属于第三方调度算法。

  • 轮询(默认)。每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某台服务器宕机,故障系统被自动剔除,使用户访问不受影响。Weight 指定轮询权值,Weight 值越大,分配到的访问机率越高,主要用于后端每个服务器性能不均的情况下
  • ip_hash。每个请求按访问 IP 的 hash 结果分配,这样来自同一个 IP 的访客固定访问一个后端服务器,有效解决了动态网页存在的 session 共享问题。
  • fair。这是比上面两个更加智能的负载均衡算法。此种算法可以依据页面大小和加载时间长短智能地进行负载均衡,也就是根据后端服务器的响应时间来分配请求,响应时间短的优先分配。Nginx 本身是不支持 fair 的,如果需要使用这种调度算法,必须下载 Nginx 的 upstream_fair 模块。
  • url_hash。此方法按访问 url 的 hash 结果来分配请求,使每个 url 定向到同一个后端服务器,可以进一步提高后端缓存服务器的效率。Nginx 本身是不支持 url_hash 的,如果需要使用这种调度算法,必须安装 Nginx 的 hash 软件包

支持的状态参数

在 HTTP Upstream 模块中,可以通过 server 指令指定后端服务器的 IP 地址和端口,同时还可以设定每个后端服务器在负载均衡调度中的状态。常用的状态有:

  • down,表示当前的 server 暂时不参与负载均衡。
  • backup,预留的备份机器。当其他所有的非 backup 机器出现故障或者忙的时候,才会请求 backup 机器,因此这台机器的压力最轻。
  • max_fails,允许请求失败的次数,默认为 1。当超过最大次数时,返回 proxy_next_upstream 模块定义的错误。
  • fail_timeout,在经历了 max_fails 次失败后,暂停服务的时间。max_fails 可以和 fail_timeout 一起使用。

注,当负载调度算法为 ip_hash 时,后端服务器在负载均衡调度中的状态不能是 weight 和 backup。

配置负载均衡

upstream webservers {
      server 192.168.18.201 weight=1;
      server 192.168.18.202 weight=1;
  }
  server {
      listen       80;
      server_name  localhost;
      #charset koi8-r;
      #access_log  logs/host.access.log  main;
      location / {
              proxy_pass      http://webservers;
              proxy_set_header  X-Real-IP  $remote_addr;
      }
}

注,upstream 是定义在 server{}之外的,不能定义在 server{}内部。定义好 upstream 之后,用 proxy_pass 引用一下即可。
如果定义在 server 内部就会报错:

"upstream" directive is not allowed here in xxxxxx

重启以后不断刷新 208 就会发现, 是 201 和 202 的内容交替出现, 然后分别查看其日志, 达到了负载均衡轮询的效果;

正文完
 0