標籤:ip地址 修改ip 情況 安全防護 單點 應用程式層 適合 失敗 問題
面對大量使用者訪問、高並發請求,海量資料,可以使用高效能的伺服器、大型資料庫,存放裝置,高效能Web伺服器,採用高效率的程式設計語言比如(Go,Scala)等,當單機容量達到極限時,我們需要考慮業務拆分和分布式部署,來解決大型網站訪問量大,並發量高,海量資料的問題。
從單機網站到分布式網站,很重要的區別是業務拆分和分布式部署,將應用拆分後,部署到不同的機器上,實現大規模分布式系統。分布式和業務拆分解決了,從集中到分布的問題,但是每個部署的獨立業務還存在單點的問題和訪問統一入口問題,為解決單點故障,我們可以採取冗餘的方式。將相同的應用部署到多台機器上。解決訪問統一入口問題,我們可以在叢集前面增加負載平衡裝置,實現流量分發。
負載平衡(Load Balance),意思是將負載(工作任務,訪問請求)進行平衡、分攤到多個操作單元(伺服器,組件)上進行執行。是解決高效能,單點故障(高可用),擴充性(水平伸縮)的終極解決方案。
本文是負載平衡詳解的第一篇文章,介紹負載平衡的原理,負載平衡分類(DNS負載平衡,HTTP負載平衡,IP負載平衡,鏈路層負載平衡,混合型P負載平衡)。部分內容摘自讀書筆記。
本次分享大綱
- 負載平衡原理
- DNS負載平衡
- HTTP負載平衡
- IP負載平衡
- 鏈路層負載平衡
- 混合型P負載平衡
一、負載平衡原理
系統的擴充可分為縱向(垂直)擴充和橫向(水平)擴充。縱向擴充,是從單機的角度通過增加硬體處理能力,比如CPU處理能力,記憶體容量,磁碟等方面,實現伺服器處理能力的提升,不能滿足大型分布式系統(網站),大流量,高並發,海量資料的問題。因此需要採用橫向擴充的方式,通過添加機器來滿足大型網站服務的處理能力。比如:一台機器不能滿足,則增加兩台或者多台機器,共同承擔訪問壓力。這就是典型的叢集和負載平衡架構:如:
- 應用叢集:將同一應用部署到多台機器上,組成處理叢集,接收負載平衡裝置分發的請求,進行處理,並返回相應資料。
- 負載平衡裝置:將使用者訪問的請求,根據負載平衡演算法,分發到叢集中的一台處理伺服器。(一種把網路請求分散到一個伺服器叢集中的可用伺服器上去的裝置)
負載平衡的作用(解決的問題):
1.解決並發壓力,提高應用處理效能(增加輸送量,加強網路處理能力);
2.提供容錯移轉,實現高可用;
3.通過添加或減少伺服器數量,提供網站伸縮性(擴充性);
4.安全防護;(負載平衡裝置上做一些過濾,黑白名單等處理)
二、負載平衡分類
根據實現技術不同,可分為DNS負載平衡,HTTP負載平衡,IP負載平衡,鏈路層負載平衡等。
2.1DNS負載平衡
最早的負載平衡技術,利用網域名稱解析實現負載平衡,在DNS伺服器,配置多個A記錄,這些A記錄對應的伺服器構成叢集。大型網站總是部分使用DNS解析,作為第一級負載平衡。如:
優點
- 使用簡單:負載平衡工作,交給DNS伺服器處理,省掉了負載平衡伺服器維護的麻煩
- 提高效能:可以支援基於地址的網域名稱解析,解析成距離使用者最近的伺服器位址,可以加快訪問速度,改善效能;
缺點
- 可用性差:DNS解析是多級解析,新增/修改DNS後,解析時間較長;解析過程中,使用者訪問網站將失敗;
- 擴充性低:DNS負載平衡的控制權在網域名稱商那裡,無法對其做更多的改善和擴充;
- 維護性差:也不能反映伺服器的當前運行狀態;支援的演算法少;不能區分伺服器的差異(不能根據系統與服務的狀態來判斷負載)
實踐建議
將DNS作為第一級負載平衡,A記錄對應著內部負載平衡的IP地址,通過內部負載平衡將請求分發到真實的Web伺服器上。一般用於互連網公司,複雜的業務系統不合適使用。如:
1.3 IP負載平衡
在網路層通過修改請求目標地址進行負載平衡。
使用者請求資料包,到達負載平衡伺服器後,負載平衡伺服器在作業系統核心進程擷取網路資料包,根據負載平衡演算法得到一台真實伺服器位址,然後將請求目的地址修改為,獲得的真實ip地址,不需要經過使用者進程處理。
真實伺服器處理完成後,響應資料包回到負載平衡伺服器,負載平衡伺服器,再將資料包源地址修改為自身的ip地址,發送給使用者瀏覽器。如:
IP負載平衡,真實物理伺服器返回給負載平衡伺服器,存在兩種方式:(1)負載平衡伺服器在修改目的ip地址的同時修改源地址。將資料包源地址設為自身盤,即源地址轉換(snat)。(2)將負載平衡伺服器同時作為真實物理伺服器叢集的閘道伺服器。
優點:
(1)在核心進程完成資料分發,比在應用程式層分發效能更好;
缺點:
(2)所有請求響應都需要經過負載平衡伺服器,叢集最大輸送量受限於負載平衡伺服器網卡頻寬;
2.4鏈路層負載平衡
在通訊協定的資料連結層修改mac地址,進行負載平衡。
資料分發時,不修改ip地址,指修改目標mac地址,配置真實物理伺服器叢集所有機器虛擬ip和負載平衡伺服器ip地址一致,達到不修改資料包的源地址和目標地址,進行資料分發的目的。
實際處理伺服器ip和資料請求目的ip一致,不需要經過負載平衡伺服器進行地址轉換,可將響應資料包直接返回給使用者瀏覽器,避免負載平衡伺服器網卡頻寬成為瓶頸。也稱為直接路由模式(DR模式)。如:
優點:效能好;
缺點:配置複雜;
實踐建議:DR模式是目前使用最廣泛的一種負載平衡方式。
2.5混合型負載平衡
由於多個伺服器群內硬體裝置、各自的規模、提供的服務等的差異,可以考慮給每個伺服器群採用最合適的負載平衡方式,然後又在這多個伺服器群間再一次負載平衡或群集起來以一個整體向外界提供服務(即把這多個伺服器群當做一個新的伺服器群),從而達到最佳的效能。將這種方式稱之為混合型負載平衡。
此種方式有時也用於單台均衡裝置的效能不能滿足大量串連請求的情況下。是目前大型互連網公司,普遍使用的方式。
方式一,如:
以上模式適合有動靜分離的情境,反向 Proxy伺服器(叢集)可以起到緩衝和動態請求分發的作用,當時靜態資源緩衝在Proxy 伺服器時,則直接返回到瀏覽器。如果動態網頁面則請求後面的應用負載平衡(應用叢集)。
方式二,如:
以上模式,適合動態請求情境。
因混合模式,可以根據具體情境,靈活搭配各種方式,以上兩種方式僅供參考。
參考:
http://www.cnblogs.com/itfly8/p/5043435.html
大型網站架構系列:負載平衡詳解(1)