分散式session的幾種實現方式
在搭建完叢集環境後,不得不考慮的一個問題就是使用者訪問產生的session如何處理。如果不做任何處理的話,使用者將出現頻繁登入的現象,比如叢集中存在A、B兩臺伺服器,使用者在第一次訪問網站時,Nginx通過其負載均衡機制將使用者請求轉發到A伺服器,這時A伺服器就會給使用者建立一個Session。當用戶第二次傳送請求時,Nginx將其負載均衡到B伺服器,而這時候B伺服器並不存在Session,所以就會將使用者踢到登入頁面。這將大大降低使用者體驗度,導致使用者的流失,這種情況是專案絕不應該出現的。
我們應當對產生的Session進行處理,通過粘性Session,Session複製或Session共享等方式保證使用者的體驗度。
以下我將說明5種Session處理策略,並分析其優劣性。
第一種:粘性session
原理:粘性Session是指將使用者鎖定到某一個伺服器上,比如上面說的例子,使用者第一次請求時,負載均衡器將使用者的請求轉發到了A伺服器上,如果負載均衡器設定了粘性Session的話,那麼使用者以後的每次請求都會轉發到A伺服器上,相當於把使用者和A伺服器粘到了一塊,這就是粘性Session機制。
優點:簡單,不需要對session做任何處理。
缺點:缺乏容錯性,如果當前訪問的伺服器發生故障,使用者被轉移到第二個伺服器上時,他的session資訊都將失效。
適用場景:發生故障對客戶產生的影響較小;伺服器發生故障是低概率事件。
實現方式:以Nginx為例,在upstream模組配置ip_hash屬性即可實現粘性Session。
upstream mycluster{
#這裡新增的是上面啟動好的兩臺Tomcat伺服器
ip_hash;#粘性Session
server 192.168.22.229:8080 weight=1;
server 192.168.22.230:8080 weight=1;
}
第二種:伺服器session複製
原理:任何一個伺服器上的session發生改變(增刪改),該節點會把這個 session的所有內容序列化,然後廣播給所有其它節點,不管其他伺服器需不需要session,以此來保證Session同步。優點:可容錯,各個伺服器間session能夠實時響應。
缺點:會對網路負荷造成一定壓力,如果session量大的話可能會造成網路堵塞,拖慢伺服器效能。
實現方式:
① 設定tomcat ,server.xml 開啟tomcat叢集功能
Address:填寫本機ip即可,設定埠號,預防埠衝突。
② 在應用裡增加資訊:通知應用當前處於叢集環境中,支援分散式
在web.xml中新增選項
第三種:session共享機制
使用分散式快取方案比如memcached、Redis,但是要求Memcached或Redis必須是叢集。
使用Session共享也分兩種機制,兩種情況如下:
① 粘性session處理方式
原理:不同的 tomcat指定訪問不同的主memcached。多個Memcached之間資訊是同步的,能主從備份和高可用。使用者訪問時首先在tomcat中建立session,然後將session複製一份放到它對應的memcahed上。memcache只起備份作用,讀寫都在tomcat上。當某一個tomcat掛掉後,叢集將使用者的訪問定位到備tomcat上,然後根據cookie中儲存的SessionId找session,找不到時,再去相應的memcached上去session,找到之後將其複製到備tomcat上。
② 非粘性session處理方式
原理:memcached做主從複製,寫入session都往從memcached服務上寫,讀取都從主memcached讀取,tomcat本身不儲存session
優點:可容錯,session實時響應。
實現方式:用開源的msm外掛解決tomcat之間的session共享:Memcached_Session_Manager(MSM)
a. 複製相關jar包到tomcat/lib 目錄下
JAVA memcached客戶端:spymemcached.jar
msm專案相關的jar包:
1. 核心包,memcached-session-manager-{version}.jar
2. Tomcat版本對應的jar包:memcached-session-manager-tc{tomcat-version}-{version}.jar
序列化工具包:可選kryo,javolution,xstream等,不設定時使用jdk預設序列化。
b. 配置Context.xml ,加入處理Session的Manager
粘性模式配置:
非粘性配置:
第四種:session持久化到資料庫
原理:就不用多說了吧,拿出一個數據庫,專門用來儲存session資訊。保證session的持久化。
優點:伺服器出現問題,session不會丟失
缺點:如果網站的訪問量很大,把session儲存到資料庫中,會對資料庫造成很大壓力,還需要增加額外的開銷維護資料庫。
第五種terracotta實現session複製
原理:Terracotta的基本原理是對於叢集間共享的資料,當在一個節點發生變化的時候,Terracotta只把變化的部分發送給Terracotta伺服器,然後由伺服器把它轉發給真正需要這個資料的節點。可以看成是對第二種方案的優化。
優點:這樣對網路的壓力就非常小,各個節點也不必浪費CPU時間和記憶體進行大量的序列化操作。把這種叢集間資料共享的機制應用在session同步上,既避免了對資料庫的依賴,又能達到負載均衡和災難恢復的效果。
小結
以上講述的就是叢集或分散式環境下,session的5種處理策略。其中就應用廣泛性而言,第三種方式,也就是基於第三方快取框架共享session,應用的最為廣泛,無論是效率還是擴充套件性都很好。而Terracotta作為一個JVM級的開源群集框架,不僅提供HTTP Session複製,它還能做分散式快取,POJO群集,跨越群集的JVM來實現分散式應用程式協調等,也值得學習一下。