標籤:
紅帽叢集套件RHCS四部曲(概念篇)
一、 什麼是RHCS
RHCS是Red Hat Cluster Suite的縮寫,也就是紅帽子叢集套件,RHCS是一個能夠提供高可用性、高可靠性、負載平衡、儲存共用且經濟廉價的叢集工具集合,它將叢集系統中三大叢集架構融合一體,可以給web應用、資料庫應用等提供安全、穩定的運行環境。
更確切的說,RHCS是一個功能完備的叢集應用解決方案,它從應用的前端訪問到後端的資料存放區都提供了一個行之有效叢集架構實現,通過RHCS提供的這種解決方案,不但能保證前端應用持久、穩定的提供服務,同時也保證了後端資料存放區的安全。
RHCS提供了叢集系統中三種叢集構架,分別是高可用性設定組群、負載平衡叢集、儲存叢集。
二、RHCS提供的三個核心功能
高可用叢集是RHCS的核心功能。當應用程式出現故障,或者系統硬體、網路出現故障時,應用可以通過RHCS提供的高顯示狀態服務管理組件自動、快速從一個節點切換到另一個節點,節點容錯移轉功能對用戶端來說是透明的,從而保證應用持續、不間斷的對外提供服務,這就是RHCS高可用叢集實現的功能。
RHCS通過LVS(Linux Virtual Server)來提供負載平衡叢集,而LVS是一個開源的、功能強大的基於IP的負載平衡技術,LVS由負載調度器和服務訪問節點群組成,通過LVS的負載調度功能,可以將用戶端請求平均的分配到各個服務節點,同時,還可以定義多種負載分配策略,當一個請求進來時,叢集系統根據調度演算法來判斷應該將請求分配到哪個服務節點,然後,由分配到的節點響應用戶端請求,同時,LVS還提供了服務節點容錯移轉功能,也就是當某個服務節點不能提供服務時,LVS會自動屏蔽這個故障節點,接著將失敗節點從叢集中剔除,同時將新來此節點的請求平滑的轉移到其它正常節點上來;而當此故障節點恢複正常後,LVS又會自動將此節點加入到叢集中去。而這一系列切換動作,對使用者來說,都是透明的,通過容錯移轉功能,保證了服務的不間斷、穩定運行。
RHCS通過GFS檔案系統來提供儲存叢集功能,GFS是Global File System的縮寫,它允許多個服務同時去讀寫一個單一的共用檔案系統,儲存叢集通過將共用資料放到一個共用檔案系統中從而消除了在應用程式間同步資料的麻煩,GFS是一個Distributed File System,它通過鎖管理機制,來協調和管理多個服務節點對同一個檔案系統的讀寫操作。
三、RHCS叢集的組成
RHCS是一個叢集工具的集合,主要有下面幾大部分組成:
? 叢集構架管理器
這是RHCS叢集的一個基礎套件,提供一個叢集的準系統,使各個節點群組成叢集在一起工作,具體包含分布式叢集管理器(CMAN)、成員關係管理、鎖管理(DLM)、設定檔管理(CCS)、柵裝置(FENCE)。
? 高可用服務管理員
提供節點服務監控和服務容錯移轉功能,當一個節點服務出現故障時,將服務轉移到另一個健康節點。
? 叢集組態管理工具
RHCS最新版本通過LUCI來配置和管理RHCS叢集,LUCI是一個基於web的叢集配置方式,通過luci可以輕鬆的搭建一個功能強大的叢集系統。
? Linux Virtual Server
LVS是一個開源的負載平衡軟體,利用LVS可以將用戶端的請求根據指定的負載策略和演算法合理的分配到各個服務節點,實現動態、智能的負載分擔。
RHCS除了上面的幾個核心構成,還可以通過下面一些組件來補充RHCS叢集功能。
? Red Hat GFS (Global File System)
GFS是Redhat公司開發的一款叢集檔案系統,目前的最新版本是GFS2,GFS檔案系統允許多個服務同時讀寫一個磁碟分割,通過GFS可以實現資料的集中管理,免去了資料同步和拷貝的麻煩,但GFS並不能孤立的存在,安裝GFS需要RHCS的底層組件支援。
? Cluster Logical Volume Manager
Cluster邏輯卷管理,即CLVM,是LVM的擴充,這種擴充允許cluster中的機器使用LVM來管理共用儲存。
? iSCSI
iSCSI是一種在Internet協議上,特別是乙太網路上進行資料區塊傳輸的標準,它是一種基於IP Storage理論的新型儲存技術,RHCS可以通過ISCSI技術來匯出和分配共用儲存的使用。
? Global Network Block Device
全域網路模組,簡稱GNBD,是GFS的一個補充組件,用於RHCS分配和管理共用儲存,GNBD分為用戶端和服務端,在服務端GNBD允許匯出多個塊裝置或者GNBD檔案,而GNBD用戶端通過匯入這些匯出的塊裝置或者檔案,就可以把它們當作本地塊裝置使用。由於現在GNBD已經停止了開發,所以使用GNBD的越來越少。
四、 RHCS叢集結構
RHCS叢集從整體上分為三大部分,負載平衡叢集、 高可用性設定組群、儲存叢集,1所示:
圖1
圖1是典型的RHCS叢集拓撲結構:整個拓撲結構分為三個層面:
最上層是LVS負載平衡層,中間一層是Real Server層,就是服務節點部分,最後一層是共用儲存層,主要用於給GFS檔案系統提供共用儲存空間。
五、RHCS叢集運行原理及功能介紹
1、 分布式叢集管理器(CMAN)
Cluster Manager,簡稱CMAN,是一個分布式叢集管理工具,它運行在叢集的各個節點上,為RHCS提供叢集管理工作。
CMAN用於管理叢集成員、訊息和通知。它通過監控每個節點的運行狀態來瞭解節點成員之間的關係,當叢集中某個節點出現故障,節點成員關係將發生改變,CMAN及時將這種改變通知底層,進而做出相應的調整。
2、鎖管理(DLM)
Distributed Lock Manager,簡稱DLM,表示一個分布式鎖管理器,它是RHCS的一個底層基礎構件,同時也為叢集提供了一個公用的鎖運行機制,在RHCS叢集系統中,DLM運行在叢集的每個節點上,GFS通過鎖管理器的鎖機制來同步訪問檔案系統中繼資料。CLVM通過鎖管理器來同步更新資料到LVM卷和卷組。
DLM不需要設定鎖管理伺服器,它採用對等的鎖管理方式,大大的提高了處理效能。同時,DLM避免了當單個節點失敗需要整體恢複的效能瓶頸,另外,DLM的請求都是本地的,不需要網路請求,因而請求會立即生效。最後,DLM通過分層機制,可以實現多個鎖空間的並行鎖模式。
3、設定檔管理(CCS)
Cluster Configuration System,簡稱CCS,主要用於叢集設定檔管理和設定檔在節點之間的同步。CCS運行在叢集的每個節點上,監控每個叢集節點上的單一設定檔/etc/cluster/cluster.conf的狀態,當這個檔案發生任何變化時,都將此變化更新到叢集中的每個節點,時刻保持每個節點的設定檔同步。例如,管理員在節點A上更新了叢集設定檔,CCS發現A節點的設定檔發生變化後,馬上將此變化傳播到其它節點上去。
rhcs的設定檔是cluster.conf,它是一個xml檔案,具體包含叢集名稱、叢集節點資訊、叢集資源和服務資訊、fence裝置等,這個會在後面講述。
4、柵裝置(FENCE)
FENCE裝置是RHCS叢集中必不可少的一個組成部分,通過FENCE裝置可以避免因出現不可預知的情況而造成的“腦裂”現象,FENCE裝置的出現,就是為瞭解決類似這些問題,Fence裝置主要就是通過伺服器或儲存本身的硬體管理介面,或者外部電源管理裝置,來對伺服器或儲存直接發出硬體管理指令,將伺服器重啟或關機,或者與網路中斷連線。
FENCE的工作原理是:當意外原因導致主機異常或者宕機時,備機會首先調用FENCE裝置,然後通過FENCE裝置將異常主機重啟或者從網路隔離,當FENCE操作成功執行後,返回資訊給備機,備機在接到FENCE成功的資訊後,開始接管主機的服務和資源。這樣通過FENCE裝置,將異常節點佔據的資源進行了釋放,保證了資源和服務始終運行在一個節點上。
RHCS的FENCE裝置可以分為兩種:內部FENCE和外部FENCE,常用的內部FENCE有IBM RSAII卡,HP的iLO卡,還有IPMI的裝置等,外部fence裝置有UPS、SAN SWITCH、NETWORK SWITCH等
5、高可用服務管理員
高顯示狀態服務管理主要用來監督、啟動和停止叢集的應用、服務和資源。它提供了一種對叢集服務的管理能力,當一個節點的服務失敗時,高可用性設定組群服務管理進程可以將服務從這個失敗節點轉移到其它健康節點上來,並且這種服務轉移能力是自動、透明的。
RHCS通過rgmanager來管理叢集服務,rgmanager運行在每個叢集節點上,在伺服器上對應的進程為clurgmgrd。
在一個RHCS叢集中,高顯示狀態服務包含叢集服務和叢集資源兩個方面,叢集服務其實就是應用服務,例如apache、mysql等,叢集資源有很多種,例如一個IP地址、一個運行指令碼、ext3/GFS檔案系統等。
在RHCS叢集中,高顯示狀態服務是和一個失敗轉移域結合在一起的,所謂失敗轉移域是一個運行特定服務的叢集節點的集合。在失敗轉移域中,可以給每個節點設定相應的優先順序,通過優先順序的高低來決定節點失敗時服務轉移的先後順序,如果沒有給節點指定優先順序,那麼叢集高可用服務將在任意節點間轉移。因此,通過建立失敗轉移域不但可以設定服務在節點間轉移的順序,而且可以限制某個服務僅在失敗轉移域指定的節點內進行切換。
6、叢集組態管理工具
RHCS提供了多種叢集配置和管理工具,常用的有基於GUI的system-config-cluster、Conga等,也提供了基於命令列的管理工具。
system-config-cluster是一個用於建立叢集和配置叢集節點的圖形化管理工具,它有叢集節點配置和叢集管理兩個部分組成,分別用於建立叢集節點設定檔和維護節點運行狀態。一般用在RHCS早期的版本中。
Conga是一種新的基於網路的叢集組態工具,與system-config-cluster不同的是,Conga是通過web方式來配置和管理叢集節點的。Conga有兩部分組成,分別是luci和ricci,luci安裝在一台獨立的電腦上,用於配置和管理叢集,ricci安裝在每個叢集節點上,Luci通過ricci和叢集中的每個節點進行通訊。
RHCS也提供了一些功能強大的叢集命令列管理工具,常用的有clustat、cman_tool、ccs_tool、fence_tool、clusvcadm等,這些命令的用法將在下面講述。
7、 Redhat GFS
GFS是RHCS為叢集系統提供的一個儲存解決方案,它允許叢集多個節點在塊層級上共用儲存,每個節點通過共用一個儲存空間,保證了訪問資料的一致性,更切實的說,GFS是RHCS提供的一個叢集檔案系統,多個節點同時掛載一個檔案系統分區,而檔案系統資料不受破壞,這是單一的檔案系統,例如EXT3、EXT2所不能做到的。
為了實現多個節點對於一個檔案系統同時讀寫操作,GFS使用鎖管理器來管理I/O操作,當一個寫進程操作一個檔案時,這個檔案就被鎖定,此時不允許其它進程進行讀寫操作,直到這個寫進程正常完成才釋放鎖,只有當鎖被釋放後,其它讀寫進程才能對這個檔案進行操作,另外,當一個節點在GFS檔案系統上修改資料後,這種修改操作會通過RHCS底層通訊機制立即在其它節點上可見。
在搭建RHCS叢集時,GFS一般作為共用儲存,運行在每個節點上,並且可以通過RHCS管理工具對GFS進行配置和管理。這些需要說明的是RHCS和GFS之間的關係,一般初學者很容易混淆這個概念:運行RHCS,GFS不是必須的,只有在需要共用儲存時,才需要GFS支援,而搭建GFS叢集檔案系統,必須要有RHCS的底層支援,所以安裝GFS檔案系統的節點,必須安裝RHCS組件。
紅帽叢集套件RHCS四部曲(概念篇)