一個大型的網站網站應該由如下6個子系統組成
負載平衡系統
反向 Proxy系統
Web伺服器系統
分布式儲存系統
底層服務系統
資料庫叢集系統
為什麼要做高並發系統設計?
事實上,針對於任何單一的網路伺服器程式,其可承受的同時串連數目是有理論峰值的,通過C++中對TSocket的定義類型:word,我們可以判定這個串連理論峰值是65535,也就是說,你的單個伺服器程式,最多可以承受6萬多的使用者同時串連。但是,在實際應用中,能達到一萬人的同時串連並能保證正常的資料交換已經是很不容易了,通常這個值都在2000到5000之間,能達到上萬已經很不錯了。目前的門戶網站動輒幾千萬的訪問量,所以,高並發的系統架構在所難免。
整體架構
真實中的網站架構也許並不如此也可以實現高效能。但是高效能的網站莫不過如此。如所示。
第一 負載平衡系統
負載平衡系統分為硬體和軟體兩種。
硬體負載平衡效率高,但是價格貴,比如F5等。
軟體負載平衡系統價格較低或者免費,效率較硬體負載平衡系統低,不過對於流量一般或稍大些網站來講也足夠使用,比如lvs。
第二 反向 Proxy系統
目前普遍使用Squid或者nginx,或者Lighttpd,Varish。
這四者又各自有很大的差異。
Squid:主要用來做反向 Proxy,使用記憶體+硬碟
Nginx:可以反向 Proxy+負載平衡+WWW解析
Lighttpd:反向 Proxy能力一般,處理FastCGI比較好,消耗記憶體很小
Varish:主要做記憶體的反向 Proxy,效能最優
第三 Web伺服器系統
由Apache負責解析PHP內容,也可以用Nginx,或者Lighttpd,相對來說Apache比較穩定。
第四 分布式儲存系統
儲存量很大,經常會達到單台伺服器無法提供的規模,比如相簿、視頻等應用。因此需要專業的大規模儲存系統。
第五 底層服務系統
根據各自需要由C/C++開發設計供上層CGI調用。
第六 資料庫系統
1)使用MySQL資料庫,考慮到Web應用的資料庫讀多寫少的特點,我們主要對讀資料庫做了最佳化,提供專用的讀資料庫和寫資料庫,在應用程式中實現讀操作和寫操作分別訪問不同的資料庫。
2)使用同步機制實現快速將主庫(寫庫)的資料庫複寫到從庫(讀庫)。一個主庫對應多個從庫,主庫資料即時同步到從庫。
3)寫資料庫有多台,每台都可以提供多個應用共同使用,這樣可以解決寫庫的效能瓶頸問題和單點故障問題。