緩存技術總結
緩存技術已經成為大型網站的一個關鍵技術,緩存設計好壞直接關系的一個網站訪問的速度,以及購置服務器的數量,甚至影響到用戶的體驗。
網站緩存按照存放的地點不同,可以分為客戶端緩存、服務端緩存。
客戶端緩存
客戶端緩存又可分為:瀏覽器緩存、網關或代理服務器緩存
網關或代理服務器緩存是將網頁緩存中網關服務器上,多用戶訪問同一個頁面時,將直接從網關服務器把頁面傳送給用戶。
瀏覽器緩存是最靠近用戶的緩存,如果啟用緩存,用戶在訪問同一個頁面時,將不再從服務器下載頁面,而是從本機的緩存目錄中讀取頁面,然後再瀏覽器中展現這個頁面。
瀏覽器緩存的控制,可以設置meta標簽,可以設置數字,也可以設置時間,如下:
<Meta http-equiv=”Expires” Content=”3600″>
<Meta http-equiv=”Expires” Content=”Wed, 26 Feb 1997 08:21:57 GMT”>
HTTP頭信息如下:
HTTP/1.1 200 OK
Date: Fri, 30 Oct 1998 13:19:41 GMT
Server: Apache/1.3.3 (Unix)
Cache-Control: max-age=3600, must-revalidate
Expires: Fri, 30 Oct 1998 14:19:41 GMT
Last-Modified: Mon, 29 Jun 1998 02:28:12 GMT
不過現在的網站為了保證用戶訪問到最新的內容,一般很少采用瀏覽器緩存,取而代之的是更加靈活的服務器緩存。
服務端緩存
服務端緩存分為:頁面緩存、數據緩存、數據庫緩存
1、頁面緩存
頁面緩存是將動態頁面直接生成靜態的頁面放在服務器端,用戶調取相同頁面時,靜態頁面將直接下載到客戶端,不再需要通過程序的運行和數據庫的訪問,大大節約了服務器的負載。
早期的網站很多使用發布系統來完成這個功能,在後臺發布時將數據和頁面模板整合成靜態頁面,存放在硬盤中。但這樣的缺陷很明顯,一是後臺的程序的編寫很 復雜,二是緩存的控制只能通過人為的方式來控制,這對一些更新十分頻繁的網站就是一個噩夢,網站可能在不停的做緩存的刪除和重建。當然後來出現了一些自動 更新這些緩存的框架,比如PHP的SMARTY模板技術,可以定義緩存過期的時間,自動去更新這些緩存。這對一些信息發布類網站已經確實適用了。
除了整個頁面的緩存技術,還有一種技術叫做“網頁片段緩存技術”,將頁面的部分而不是全部進行緩存。代表作有ESI cache。
2、數據緩存
但是當WEB2.0興起的今天,信息的發布已經不再是管理員統一發布的了,而是所有的用戶都在發布信息,用戶發布完信息後當然是想看到這些信息,而不是等到緩存時間到刷新後才看到這些數據,於是數據緩存的相關技術也就應運而生了。
比較有名的數據緩存框架有ehcache和 memcached。
ehcache有很多緩存的分支(包括頁面緩存的模塊),但最核心的模塊還是它的數據緩存部分,比如,當ehcache和hibernate進行整合 時,能將查詢出的對象集合放入內存中,下次如果再查詢這個查詢,將直接從內存中返回這個數據集合,不需要再進行數據庫的查詢,同時,你可以配置緩存的刷新 模式,有read-only,nonstrict-read-write,read-write 幾種模式,其中read-only表示緩存是不刷新的(要刷新就只有重啟了),nonstrict-read-write表示刷新是不及時的,你可以設置 超時的時間去刷新,read-write表示在數據發生變化時緩存都會發生刷新,具體怎麽配置可能就要根據具體業務了。
Memcached大 致的原理也和ehcache 相同,將數據采用鍵值的形式存放在內存中,使用時可以將查詢的md5作為鍵,查詢的結果作為值。相對ehcache而言,memcached是一個工 具,ehcache是一個框架,memcached更加底層更加靈活,當然你也要寫相應的代碼去使用它。
這是一張網上的memcached圖,說明了memcached在系統中的位置。
近幾年興起的NOSQL技術,雖然現在歸於數據庫的一種,但其本質也是緩存技術和數據庫技術的一種融合產物。
目前緩存的做法分為兩種模式:
內存緩存:緩存數據存放在服務器的內存空間中。
優點:速度快 缺點:資源有限
文件緩存:緩存數據存放在服務器的硬盤空間中。
優點:容量大 缺點:速度偏慢,尤其在緩存數量巨大時
數據庫緩存
數據庫的緩存一般由數據庫提供,比如ORACLE,可以對表建立高速緩存,提高對經常訪問的數據的訪問速度。
總結
究竟怎樣去使用緩存,使用哪一層次的緩存,是由網站本身的具體業務來決定的。緩存技術的一個原則是:讓數據更靠近用戶。
緩存技術總結