今天,'大型伺服器'模式已經過去,取而代之的是大量的小伺服器,使用各種各樣的負載平衡技術。這是一種更可行的方法,將使硬體成本降至最低。
'更多小伺服器'的優勢超過過去的'大型伺服器'模式體現在兩個方面:
1. 如果伺服器宕機,那麼負載平衡系統將停止請求到宕機的伺服器,轉而分發負載到其他正常啟動並執行伺服器上。
2. 擴充你的伺服器更加容易。你要做的僅僅是加入新的伺服器到負載平衡系統。不需要中斷你的應用運行。
所以,把握住這個機會:). 當然,代價就是這要求你的應用開發時增加一點複雜度。這就是本文要覆蓋的內容。
這時你可能對自己說: '但是我怎麼知道我正在使用負載平衡呢?'。最誠實的回答是,如果你正在問這個問題,那麼答案是你多半沒有在使用負載平衡系統並且你的系統不需要考慮這個問題。大多數情況,當應用成長足夠大的規模時,負載平衡就需要明確提出和設定了。然而,我也偶爾看見虛擬機器主機公司為客戶的應用做這個負載平衡,或者像下面描述的那樣要自己來做。
在繼續下面的內容之前,我要指出本文主要描述PHP的負載平衡。將來我可能會寫有關資料負載平衡的文字,但是現在你必須等待。
注意,我一直提“web應用”而不是website,這是想區分'web應用'是那些複雜的網站往往涉及伺服器端編程和資料庫,而不是website那樣只顯示簡單的靜態內容。
1. PHP檔案
第一個問題是,如果你有大量的小型伺服器,你怎麼把你的php檔案上傳到所有的伺服器上?有如下的方法供你參考:
1. 分別上傳所有的檔案到每一個伺服器 , 這種方法帶來的問題是:想像一下你有20個伺服器,那麼上傳過程中這將很容易導致錯誤,並且更新時極有可能導致不同伺服器上有不同版本的檔案。
2. 使用 'rsync ' (或類似的軟體) . 這樣的工具能同步本地目錄和多個遠程主機目錄上的檔案。
3. 使用版本控制軟體(如subversion ) . 這是我最喜歡的方法。用它可以很好地維護我得代碼,當發布我的應用程式時,可以在每一個伺服器上運行svn update命令同步。這種方法也使切換伺服器得代碼到過去的某一個版本更加容易。
4. 使用一個檔案伺服器(你可能發現NFS 非常適合做這件事情). 這種方式是使用一個檔案伺服器來存放你的web應用. 當然,如果你的檔案伺服器宕機,那麼多所有你的網站將不能使用。這時,你就需要花費更多的開支來恢複它。
選擇哪種方式依賴於你的需求和你掌握的技能。如果你使用版本控制系統,那麼你可能得計劃一個方法如果同時執行一個更新命令更新所有伺服器上的代碼。然而,如果使用檔案伺服器,你就要實現一些失敗恢複機制,防止萬一伺服器宕機導致請求失敗。
2. 檔案上傳
當只有一台伺服器時,檔案上傳不是一個問題。但是當我們有多台伺服器時,那麼上傳的檔案應該怎麼存放呢?上傳檔案的問題和跨伺服器php檔案儲存體是類似的。下面是幾種可能的方案:
1. 把檔案儲存體到資料庫中 。大多數資料允許儲存位元據。當你請求檔案下載時,訪問資料把位元據和相應的檔案名稱和類型輸出給使用者。在使用這種方案前應該考慮資料庫怎樣儲存你的檔案。該方法的問題在於如果資料庫伺服器宕機將使檔案不可用。
2. 在一個檔案伺服器上儲存上傳的檔案 . 與前面的介紹一樣,你要安裝一個檔案伺服器讓所有web伺服器共用,把所有上傳的檔案上傳到這裡,上傳後所有的web伺服器就都可以使用它。但是,如果檔案伺服器宕機,那麼可能發生影像檔下載中斷。
3. 設計你自己的上傳機制傳輸檔案到伺服器到每一個伺服器 . 這個方法沒有單個檔案伺服器或者資料庫方案的缺陷,但是將增加你代碼的複雜度。例如,如果上傳到多個伺服器過程中,伺服器宕機,你要怎麼處理?
用資料庫儲存上傳檔案但是設計一個檔案快取機制是一個不錯的方案。當伺服器接收一個檔案下載請求時,首先檢查緩衝系統中是否有該檔案,如果發現那麼從緩衝系統下載,否則從資料庫讀取並把它緩衝到檔案系統中。
3. 會話(Sessions)
如果你熟悉php的session 處理,你將可能知道預設情況下,它儲存session資料在伺服器的臨時檔案裡。而且,這個檔案僅僅在你請求處理的那個伺服器上,但是接下來的請求可能被另外一個伺服器處理,這將在另一個伺服器上產生新的session。這導致session頻繁地不被識別,如登入使用者總是要求重新登入。
我推薦的方案是,要麼重新php內建的session處理機制儲存session資料到資料庫,或者實現你自己的機制保證發送一個使用者的請求到同一台伺服器。
4. 配置(Configuration)
儘管這個話題不是和php特別相關,我感覺還是有必要提及。當運行叢集伺服器時,用某種方法保持伺服器之間的設定檔同步是一個好主意。如果設定檔不一致,可能導致一些非常奇怪的斷斷續續的行為導致很難排查這些問題。
我推薦使用版本控制系統單獨管理他們。這樣你可以為不同的項目安裝儲存不同的php設定檔,也可以保持所有伺服器設定檔同步。
5. 日誌(Logging)
像配置問題一樣,logging不是僅僅和php相關。但是對於保持伺服器健康運行它仍然是非常重要的。沒有正確的logging系統,你怎麼知道如果PHP代碼開始產生錯誤(在系統正式運行時,你總是關閉display_errors 設定,不是嗎?)
有幾種方法你可以實現logging:
1. 在每一個伺服器上記錄日誌。 這是最簡單的方法。每一個機器僅僅記錄一個檔案。好處是簡單,可能只要很少的配置。但是,隨著伺服器數量的增多,監控每台伺服器上的記錄檔將變得非常困難。
2. 記錄日誌到一個共用 這種方法每一個伺服器仍然有這個記錄檔,但是他們通過共用機制被儲存在一個中央檔案伺服器上,這將使監控日誌變得更簡單。該方案的問題在於,如果檔案伺服器不可用將導致一個簡單的日誌不能寫入問題最終導致整個應用崩潰。
3. 記錄日誌到logging伺服器 你可以使用一個logging軟體,如syslog 來把所有的日誌寫到一個中央伺服器。儘管這個方法要求更多的配置,但是他也提供了最健壯的方案。