php大型網站如何提高效能和併發訪問
一、大型網站效能提高策略:
大型網站,比如入口網站,在面對大量使用者訪問、高併發請求方面,基本的解決方案集中在這樣幾個環節:使用高效能的伺服器、高效能的資料庫、高效率的程式語言、還有高效能的Web容器。這幾個解決思路在一定程度上意味著更大的投入。
web容器是一種服務程式,在伺服器一個埠就有一個提供相應服務的程式,而這個程式就是處理從客戶端發出的請求,如Java中的Tomcat容器,ASP的IIS或PWS都是這樣的容器。一個伺服器可以多個容器。
1、HTML靜態化
其實大家都知道,效率最高、消耗最小的就是純靜態化的html頁面,所以我們儘可能使我們的網站上的頁面採用靜態頁面來實現,這個最簡單的方法其實也是最有效的方法。
2、圖片伺服器分離
大家知道,對於Web伺服器來說,不管是Apache、IIS還是其他容器,圖片是最消耗資源的,於是我們有必要將圖片與頁面進行分離,這是基本上大型網站都會採用的策略,他們都有獨立的、甚至很多臺的圖片伺服器。這樣的架構可以降低提供頁面訪問請求的伺服器系統壓力,並且可以保證系統不會因為圖片問題而崩潰。
在應用伺服器和圖片伺服器上,可以進行不同的配置優化,比如apache在配置ContentType的時候可以儘量少支援、儘可能少的LoadModule,保證更高的系統消耗和執行效率。
3、資料庫叢集、庫表雜湊
大型網站都有複雜的應用,這些應用必須使用資料庫,那麼在面對大量訪問的時候,資料庫的瓶頸很快就能顯現出來,這時一臺資料庫將很快無法滿足應用,於是我們需要使用資料庫叢集或者庫表雜湊。
在資料庫叢集方面,很多資料庫都有自己的解決方案,常用的MySQL提供的Master/Slave也是類似的方案。
叢集通常會使用CDN與GSBL與DNS負載均衡技術,每個地區一組前臺伺服器群,例如:網易,百度使用了DNS負載均衡技術,每個頻道一組前臺伺服器,一搜使用了DNS負載技術,所有頻道共用一組前臺伺服器叢集。
庫表雜湊是常用並且最有效的解決方案。
我們在應用程式中安裝業務和應用或者功能模組將資料庫進行分離,不同的模組對應不同的資料庫或者表,再按照一定的策略對某個頁面或者功能進行更小的資料庫雜湊,比如使用者表,按照使用者ID進行表雜湊,這樣就能夠低成本的提升系統的效能並且有很好的擴充套件性。
sohu的論壇就是採用了這樣的架構,將論壇的使用者、設定、帖子等資訊進行資料庫分離,然後對帖子、使用者按照板塊和ID進行雜湊資料庫和表,最終可以在配置檔案中進行簡單的配置便能讓系統隨時增加一臺低成本的資料庫進來補充系統性能。
4、快取
快取一詞搞技術的都接觸過,很多地方用到快取。網站架構和網站開發中的快取也是非常重要。這裡先講述最基本的兩種快取。高階和分散式的快取在後面講述。
架構方面的快取,對Apache比較熟悉的人都能知道Apache提供了自己的快取模組,也可以使用外加的Squid模組進行快取,這兩種方式均可以有效的提高Apache的訪問響應能力。
網站程式開發方面的快取,Linux上提供的Memory Cache是常用的快取介面,可以在web開發中使用,比如用Java開發的時候就可以呼叫MemoryCache對一些資料進行快取和通訊共享,一些大型社群使用了這樣的架構。另外,在使用web語言開發的時候,各種語言基本都有自己的快取模組和方法,PHP有Pear的Cache模組,Java就更多了,.net不是很熟悉,相信也肯定有。
5、映象
映象是大型網站常採用的提高效能和資料安全性的方式,映象的技術可以解決不同網路接入商和地域帶來的使用者訪問速度差異,比如ChinaNet和EduNet之間的差異就促使了很多網站在教育網內搭建映象站點,資料進行定時更新或者實時更新。
6、負載均衡
負載均衡將是大型網站解決高負荷訪問和大量併發請求採用的高階解決辦法。
負載均衡技術發展了多年,有很多專業的服務提供商和產品可以選擇,我個人接觸過一些解決方法,其中有兩個架構可以給大家做參考
二、Php程式碼編寫優化:
1. echo比print要快很多。
兩個方法都會在頁面上列印東西,不過echo不返回任何值,print會在成功或失敗的時候返回0或1。
2. include_once比include更加耗時。
因為它需要去檢查你要包含的class是否已經被包含進來。
3. 對於長段落的字串一定要使用單引號,而不是雙引號。
因為雙引號會去搜索字串中的變數。比如:echo ‘This is long string’.$name就比echo “This is long string $name”要快很多。
4. 不要再迴圈中巢狀使用for迴圈
5. 如果能將函式定義為靜態的
那麼就不要定義成為成員函式,靜態函式比成員函式快33%。
6. 如果你可以不通過正則表示式就能解決問題
那麼就別用正則。正則表示式比PHP原生的函式要慢一些。
例如使用(打折網http://dazhes.com)str_replace取代preg_replae。
7. 儘量不要使用相對路徑來包含檔案
在相對路徑中查詢檔案,會現在當前目錄中查詢,然後依次再查詢。這樣查詢檔案就很 慢。最好是先定義WEB_ROOT這樣的常量,然後使用這個常量來包含檔案。
8. 全等符號===比相等==要快
而且if(1 == ’1′)會返回true,if(0 == ”)也會返回true,而當你使用全等符號的時候 if(1 ===’1′)和if(0===”)都會返回false。所以當你在程式中需要檢測一些布林變數 的時候最好使用全等符號。
三、針對thinkphp 有以下幾種方式
1. 關閉除錯模式
由於關閉除錯模式之後,系統會自動生成專案編譯快取以及關閉日誌寫 入,這樣可以減少很多的IO載入和日誌寫入的開銷。
2. 開啟頁面壓縮輸出
3.1版本開始,增加了OUTPUT_ENCODE配置引數,用於控制頁面壓縮輸出。
3. 開啟快取
在網站部署環境安裝APC或者Xcache快取能夠有效提升網站執行效能和記憶體佔用
XCache 是一個開源的 opcode 快取器/優化器, 這意味著他能夠提高您伺服器上 的 PHP 效能. 他通過把編譯 PHP 後的資料緩衝到共享記憶體從而避免重複的編譯 過程, 能夠直接使用緩衝區已編譯的程式碼從而提高速度. 通常能夠提高您的頁面生 成速率 2 到5 倍, 降低伺服器負載.
Alternative PHP Cache (APC)是一種對PHP有效的開放源高速緩衝儲存器工具,它能夠快取opcode的php中間碼。
4. 欄位快取
預設情況下,欄位快取是自動生成的,在開發完成之後,基本上資料庫的變動變得 比較少,因此可以考慮合併欄位快取到對應的模型類,這樣能夠減少每次讀取欄位 快取的IO開銷。合併的方法是在Runtime/Data/_fields下面找到對應的欄位快取檔案
四、 資料庫優化
1、選擇正確的儲存引擎
以 MySQL為例,包括有兩個儲存引擎 MyISAM 和 InnoDB,每個引擎都有利有弊。
MyISAM 適合於一些需要大量查詢的應用。InnoDB 的趨勢會是一個非常複雜的儲存引擎,對於一些小的應用,它會比 MyISAM 還慢。但是它支援“行鎖” ,支援事務。
2、優化欄位的資料型別
記住一個原則,越小的列會越快。對於大多數的資料庫引擎來說,硬碟操作可能是最重大的瓶頸。所以,把你的資料變得緊湊會對這種情況非常有幫助,因為這減少了對硬碟的訪問。
如果一個表只會有幾列罷了(比如說字典表,配置表),那麼,我們就沒有理由使用 INT 來做主鍵,使用 MEDIUMINT, SMALLINT 或是更小的 TINYINT 會更經濟一些。如果你不需要記錄時間,使用 DATE 要比 DATETIME 好得多。當然,你也需要留夠足夠的擴充套件空間。
3、為搜尋欄位新增索引
索引並不一定就是給主鍵或是唯一的欄位。如果在你的表中,有某個欄位你總要會經常用來做搜尋,那麼最好是為其建立索引,除非你要搜尋的欄位是大的文字欄位,那應該建立全文索引。
4、避免使用Select *從資料庫裡讀出越多的資料,那麼查詢就會變得越慢。並且,如果你的資料庫伺服器和WEB伺服器是兩臺獨立的伺服器的話,這還會增加網路傳輸的負載。即使你要查詢資料表的所有欄位,也儘量不要用*萬用字元,善用內建提供的欄位排除定義也許能給帶來更多的便利。
5、使用 ENUM 而不是 VARCHAR
ENUM 型別是非常快和緊湊的。在實際上,其儲存的是 TINYINT,但其外表上顯示為字串。這樣一來,用這個欄位來做一些選項列表變得相當的完美。例如,性別、民族、部門和狀態之類的這些欄位的取值是有限而且固定的,那麼,你應該使用 ENUM 而不是 VARCHAR。
6、儘可能的使用 NOT NULL
除非你有一個很特別的原因去使用 NULL 值,你應該總是讓你的欄位保持 NOT NULL。 NULL其實需要額外的空間,並且,在你進行比較的時候,你的程式會更復雜。 當然,這裡並不是說你就不能使用NULL了,現實情況是很複雜的,依然會有些情況下,你需要使用NULL值。
7、固定長度的表會更快
如果表中的所有欄位都是“固定長度”的,整個表會被認為是 “static” 或 “fixed-length”。 例如,表中沒有如下型別的欄位: VARCHAR,TEXT,BLOB。只要你包括了其中一個這些欄位,那麼這個表就不是“固定長度靜態表”了,這樣,MySQL 引擎會用另一種方法來處理。
固定長度的表會提高效能,因為MySQL搜尋得會更快一些,因為這些固定的長度是很容易計算下一個資料的偏移量的,所以讀取的自然也會很快。而如果欄位不是定長的,那麼,每一次要找下一條的話,需要程式找到主鍵。
並且,固定長度的表也更容易被快取和重建。不過,唯一的副作用是,固定長度的欄位會浪費一些空間,因為定長的欄位無論你用不用,他都是要分配那麼多的空間。
使用“垂直分割”技術,你可以分割你的表成為兩個一個是定長的,一個則是不定長的。
8、垂直分割 “垂直分割”是一種把資料庫中的表按列變成幾張表的方法,這樣可以降低表的複雜度和欄位的數目,從而達到優化的目的。
例如:在User表中有一個欄位是家庭地址,這個欄位是可選欄位,相比起,而且你在資料庫操作的時候除了個人資訊外,你並不需要經常讀取或是改寫這個欄位。那麼,為什麼不把他放到另外一張表中呢? 這樣會讓你的表有更好的效能,大家想想是不是,大量的時候,我對於使用者表來說,只有使用者ID,使用者名稱,口令,使用者角色等會被經常使用。小一點的表總是會有好的效能。
另外,你需要注意的是,這些被分出去的欄位所形成的表,你不會經常性地去Join他們,不然的話,這樣的效能會比不分割時還要差,而且,會是極數級的下降。
9、EXPLAIN 你的 SELECT 查詢;
使用 EXPLAIN 關鍵字可以讓你知道MySQL是如何處理你的SQL語句的。這可以幫你分析你的查詢語句或是表結構的效能瓶頸。EXPLAIN 的查詢結果還會告訴你你的索引主鍵被如何利用的,你的資料表是如何被搜尋和排序的……等等,等等。
通常我們可以對比較複雜的尤其是涉及到多表的SELECT語句,把關鍵字EXPLAIN加到前面。你可以使用phpmyadmin來做這個事。詳情見附件explain.doc.
五、前段優化
優化完後端和資料庫之後,我們緊接著要做的就是針對輸出的頁面優化你的前端頁面和資原始檔,主要包括對圖片、JS和樣式檔案的優化。
我們建議採用下列網頁效能測試工具進行檢測和分析,會給出相關的優化建議:
PageSpeed 谷歌開發的工具
網站管理員和網路開發人員可以使用PageSpeed來評估他們網頁的效能,並獲得有關如何改進效能的建議。
yslow YSlow
可以對網站的頁面進行分析,並告訴你為了提高網站效能,如何基於某些規則而進行優化。