剛踏入職場的程式設計師(2年以內初級程式設計師)如何快速踏實地提升自己的能力
一、關於Nginx的負載均衡
在伺服器叢集中,Nginx起到一個代理伺服器的角色(即反向代理),為了避免單獨一個伺服器壓力過大,將來自使用者的請求轉發給不同的伺服器。
二、Nginx負載均衡策略
負載均衡用於從“upstream”模組定義的後端伺服器列表中選取一臺伺服器接受使用者的請求。一個最基本的upstream模組是這樣的,模組內的server是伺服器列表:
#動態伺服器組
upstream dynamic_zuoyu {
server localhost:8080; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082; #tomcat 8.5 server localhost:8083; #tomcat 9.0 }
在upstream模組配置完成後,要讓指定的訪問反向代理到伺服器列表:
#其他頁面反向代理到tomcat容器
location ~ .\*$ {
index index.jsp index.html;
proxy_pass http://dynamic_zuoyu;
}
這就是最基本的負載均衡例項,但這不足以滿足實際需求;目前Nginx伺服器的upstream模組支援6種方式的分配:
負載均衡策略
輪詢 | 預設方式 |
---|---|
weight | 權重方式 |
ip_hash | 依據ip分配方式 |
least_conn | 最少連線方式 |
fair(第三方) | 響應時間方式 |
url_hash(第三方) | 依據URL分配方式 |
在這裡,只詳細說明Nginx自帶的負載均衡策略,第三方不多描述。
1、輪詢
最基本的配置方法,上面的例子就是輪詢的方式,它是upstream模組預設的負載均衡預設策略。每個請求會按時間順序逐一分配到不同的後端伺服器。
有如下引數:
fail_timeout與max_fails結合使用。max_fails設定fail_timeout引數設定的時間內最大失敗次數,如果在這個時間內,所有針對該伺服器的請求都失敗了,那麼認為該伺服器會被認為是停機了,fail_time伺服器會被認為停機的時間長度,預設為10s。backup標記該伺服器為備用伺服器。當主伺服器停止時,請求會被髮送到它這裡。down標記伺服器永久停機了。
注意:
- 在輪詢中,如果伺服器down掉了,會自動剔除該伺服器。
- 預設配置就是輪詢策略。
- 此策略適合伺服器配置相當,無狀態且短平快的服務使用。
2、weight
權重方式,在輪詢策略的基礎上指定輪詢的機率。例子如下:
#動態伺服器組
upstream dynamic_zuoyu {
server localhost:8080 weight=2; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082 backup; #tomcat 8.5 server localhost:8083 max_fails=3 fail_timeout=20s; #tomcat 9.0 }
在該例子中,weight引數用於指定輪詢機率,weight的預設值為1,;weight的數值與訪問比率成正比,比如Tomcat 7.0被訪問的機率為其他伺服器的兩倍。
注意:
- 權重越高分配到需要處理的請求越多。
- 此策略可以與least_conn和ip_hash結合使用。
- 此策略比較適合伺服器的硬體配置差別比較大的情況。
3、ip_hash
指定負載均衡器按照基於客戶端IP的分配方式,這個方法確保了相同的客戶端的請求一直髮送到相同的伺服器,以保證session會話。這樣每個訪客都固定訪問一個後端伺服器,可以解決session不能跨伺服器的問題。
動態伺服器組
upstream dynamic_zuoyu {
ip_hash; #保證每個訪客固定訪問一個後端伺服器
server localhost:8080 weight=2; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082; #tomcat 8.5 server localhost:8083 max_fails=3 fail_timeout=20s; #tomcat 9.0 }
注意:
- 在nginx版本1.3.1之前,不能在ip_hash中使用權重(weight)。
- ip_hash不能與backup同時使用。
- 此策略適合有狀態服務,比如session。
- 當有伺服器需要剔除,必須手動down掉。
4、least_conn
把請求轉發給連線數較少的後端伺服器。輪詢演算法是把請求平均的轉發給各個後端,使它們的負載大致相同;但是,有些請求佔用的時間很長,會導致其所在的後端負載較高。這種情況下,least_conn這種方式就可以達到更好的負載均衡效果。
#動態伺服器組
upstream dynamic_zuoyu {
least_conn; #把請求轉發給連線數較少的後端伺服器
server localhost:8080 weight=2; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082 backup; #tomcat 8.5 server localhost:8083 max_fails=3 fail_timeout=20s; #tomcat 9.0 }
注意:
- 此負載均衡策略適合請求處理時間長短不一造成伺服器過載的情況。
5、第三方策略
第三方的負載均衡策略的實現需要安裝第三方外掛。
①fair
按照伺服器端的響應時間來分配請求,響應時間短的優先分配。
#動態伺服器組
upstream dynamic_zuoyu {
server localhost:8080; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082; #tomcat 8.5 server localhost:8083; #tomcat 9.0 fair; #實現響應時間短的優先分配
}
②url_hash
按訪問url的hash結果來分配請求,使每個url定向到同一個後端伺服器,要配合快取命中來使用。同一個資源多次請求,可能會到達不同的伺服器上,導致不必要的多次下載,快取命中率不高,以及一些資源時間的浪費。而使用url_hash,可以使得同一個url(也就是同一個資源請求)會到達同一臺伺服器,一旦快取住了資源,再此收到請求,就可以從快取中讀取。
#動態伺服器組
upstream dynamic_zuoyu {
hash $request_uri; #實現每個url定向到同一個後端伺服器
server localhost:8080; #tomcat 7.0 server localhost:8081; #tomcat 8.0 server localhost:8082; #tomcat 8.5 server localhost:8083; #tomcat 9.0 }
三、總結
以上便是6種負載均衡策略的實現方式,其中除了輪詢和輪詢權重外,都是Nginx根據不同的演算法實現的。在實際運用中,需要根據不同的場景選擇性運用,大都是多種策略結合使用以達到實際需求。