簡單的說,集群(cluster)就是一組電腦,它們作為一個整體向使用者提供一組網路資源。 這些單個的電腦系統就是集群的節點(node)。 一個理想的集群是,使用者從來不會意識到集群系統底層的節點,在他們看來,集群是一個系統,而非多個電腦系統。 並且集群系統的管理員可以隨意增加和刪改集群系統的節點。
下面就伺服器常用的三款集群軟體做一個對比分析介紹:
1、ROSE HA 伺服器集群軟體
在雙機熱備的架構中,除了要考慮切換時間外,要根據每個系統的作業環境,包括網路系統是單網或是雙網,資料庫的安裝和作業內容及使用者端的設備是經由廣域網路路、區域網路接入不同使用者有不同的需求,而要求有不同的切換模式, 所以選擇不同的切換模式,可以使使用者端的改變達到最少的程度。
ROSE HA根據不同的行業及各行業不同的需求設計多種備援模式以彈性的調適用戶的最佳組合及選擇。
ROSE HA系統運作方式
在正常的運作情形之下,主機之間透過冗余偵測線路互相偵測,當任一主機有錯誤產生時,ROSE HA提供嚴謹的判斷與分析,確認主機出錯之後,才完全啟動備援接管動作。
※ 支援各種作業系統平臺
※ 支援眾多的UNIX平臺(如:IBM、DEC、HP、NCR、SUN、SGI、NEC、SIEMENS等)
※ 支援眾多的PC平臺的Unix系統(如:SCO/Unix、Solraris X86等)
※ 支援各種資料庫:MS-SQL、Oracle 、Informix、Sysbase、Excheng|、Lotus/Nose、DB2等
接管動作包括
※ 檔案系統( File System)
※ 資料庫( Database)
※ 網路位址( IP Address)
※ 應用程式(AP)
※ 系統內容(OS)
※ 容錯備援運作過程
自動偵測(Auto-Detect)階段,由主機上的軟體通過冗余偵測線,經由複雜的監聽程式。 邏輯判斷,來相互偵測對方運行的情況,所檢查的專案有:
※ 主機硬體(CPU和周邊)
※ 主機網路
※ 主機作業系統
※ 資料庫引擎及其它應用程式
※ 主機與磁碟陣列連線
為確保偵測的正確性,而防止錯誤的判斷,可設定安全偵測時間,包括偵測時間間隔,偵測次數以調整安全係數,並且由主機的冗余通信連線,將所彙集的訊息記錄下來,以供維護參考。
自動切換(Auto-Switch)階段 某一主機如果確認對方故障,則正常主機除繼續進行原來的任務,還將依據各種容錯備援模式接管預先設定的備援作業程式,並進行後續的程式及服務。
自動復原(Auto-Recovery)階段 在正常主機代替故障主機工作後,故障主機可離線進行修復工作。 在故障主機修復後,透過冗余通訊線與原正常主機連線,自動切換回修復完成的主機上。 整個回復過程完成由EDI-HA自動完成,亦可依據預先配置,選擇回復動作為半自動或不回復。
多種容錯備援模式
1,雙機相互備援模式
2,主從式備援模式
3,Hot Standby模式
4,雙網卡,單網段類型
5,雙網卡、雙網段模式
6,多主機備援系統
使用者定制模式
在雙機熱備的架構中,除了要考慮切換時間外,要根據每個系統的作業環境,包括網路系統是單網或是雙網,資料庫的安裝和作業內容及使用者端的設備是經由廣域網路路、區域網路接入不同使用者有不同的需求,而要求有不同的切換模式, 所以選擇不同的切換模式,可以使使用者端的改變達到最少的程度。
ROSE HA根據不同的行業及各行業不同的需求設計多種備援模式以彈性的調適用戶的最佳組合及選擇。
※ 雙主機通過一條TCP/IP網路線以及一條RS-232電纜線相聯
※ 雙主機各自通過一條SCSI電纜線與RAID磁碟陣列相聯
※ 雙主機各自運行不同的作業,彼此獨立,並相互備援
※ 主機A故障後,主機B自動接管主機A運行
※ 主機A的作業將在主機B上自動運行
※ 主機A的客戶(client)要在主機B上重新登錄
※ 主機A修復後,主機B將把A的作業自動交還主機A
※ 已經連到主機B上的A的客戶需要在主機A上重新登錄
※ 主機B故障時,主機A接管主機B的作業和資料
※ 主機B修復時,主機A再將原來接管的作業和資料交還主機B
※ 雙主機通過一條TCP/IP網路線以及一條RS-232電纜線相聯
※ 雙主機各自通過一條SCSI電纜線與RAID相聯
※ 主機A為Master,主機B為Slave
※ 主機A處理作業和資料,主機B作為熱備份機
※ 主機A故障後,主機B自動接管主機A的作業和資料
※ 主機B同時接管A的主機名稱(Host)及網路位址(IP)
※ 主機A的作業將在主機B上自動運行
※ 主機A的客戶(client)可繼續運行,無需重新登錄
※ 主機B現為Master,主機A修復後作為Slave,作為熱備份機
※ 2個主機建議使用規格相同的主機
模式3---雙機熱備份(Hot Standby)
※ 雙主機通過一條TCP/IP網路線以及一條RS-232電纜線相聯
※ 雙主機各自通過一條SCSI電纜線與RAID相聯
※ 主機A為Master,主機B為Slave
※ 主機A處理作業和資料,主機B作為熱備份機
※ 主機A故障後,主機B自動接管主機A的作業和資料
※ 主機B同時接管A的主機名稱(Host)及網路位址(IP)
※ 主機A的作業將在主機B上自動運行
※ 主機A的客戶(client)可繼續運行,無需重新登錄
※ 主機A修復後,自動接管原來的作業和資料,主機B繼續作備份機
模式4---雙機雙網路介面卡(Dual Ethernet Adapter)
※ 雙主機各自通過一條SCSI電纜線與RAID相聯
※ 雙主機各自運行不同的作業
※ 每一主機定義第一網口和第二網口
※ 主機A上第一網口在故障時由第二網口接管
※ 主機B上第一網口在故障時由第二網口接管
※ 主機A故障後,主機B自動接管主機A的作業和資料
※ 主機B同時接管A的主機名稱(Host)及網路位址(IP)
※ 主機A的作業將在主機B上自動運行
※ 主機A的客戶(client)可繼續運行,無需重新登錄
※ 主機A同樣可作B的備份機
※ 進行數機雙工備份和網卡的備份
ROSE HA 新功能介紹
RoseHA for Windows
增加了對Team 類型網卡的支援。
增加了對磁碟陣列的硬體鎖功能的支援。
修改了Volume資源的配置方式,以一個磁片設備(Disk)作為基本磁碟區單元進行配置。
增強了對共用卷的處理,在主機發生卷資源切換不成功時,會主動關機或重新開機,確保備機接管成功。
對於NT Server 類型的資源,增加了新的配置方式:除傳統的直接選擇NT Service方式進行配置外,還可以通過指定Start、Stop、Agent三個欄目(的程式)的方式進行配置。
在Userdefine類型資源中,增加了是否允許Agent程式出現運行視窗的選項。
增強了資源的修改編輯功能。
增加了共用盤盤符被佔用的報警機制。
增加了對Switch或HUB斷電的適應能力。
增強了對FileShare資源可用共用資源的處理。
增加了RoseHA介面中將各種配置資訊保存到文字檔的功能。
增加了日誌部分的內容資訊。
重新設計了HOSTID機制,確保重新安裝系統,硬碟重新分區不會改變HOSTID。
其它管理介面各個方面操作及顯示上的修改完善。
手冊針對相關功能進行了修改和補充。
RoseHA for Linux
支援各種主流最新的Linux作業系統,如RedHat 7.x, RedHat 8.x。
新的基於JAVA2的GUI管理配置介面。
支援Intel網卡的iANS功能,Intel網卡必須使用Intel提供的e100, e1000的驅動程式。
配置介面中增加了GroupID的設定功能,可以更加輕鬆直觀的將多個服務指定為一組,這些組中的服務將同時切換帶入帶出。
配置介面中提供了多個卷的配置方式,可以為一個Job配置一個以上的卷資源。
增加了管理介面的修改功能,可以在管理介面中直接修改處於BringOut狀態的Job,無須刪除後重新配置。
增加了新的磁片系統監控機制,可以更加高效,準確,及時的監控磁碟陣列狀態。
規範統一Agent的傳回值,正常時返回0值,異常時非0值。
增強安全性,修改部分執行檔許可權。 確保root使用者才能運行HA的相關程式。
RoseHA for UnixWare
支援UnixWare 7.1.1最新補丁包 uw711m2.ima
新的基於JAVA2的GUI管理配置介面。
增加了新的磁片系統監控機制,可以更加高效,準確,及時的監控磁碟陣列狀態。
規範統一Agent的傳回值,正常時返回0值,異常時非0值。
增強安全性,修改部分執行檔許可權。 確保root使用者才能運行HA的相關程式。
更新HostID機制。 通過安裝RoseHA後,使用RoseHA提供的hostid工具獲得申請License所需的hostid,不再使用UnixWare系統的SystemID作為hostid。 確保重新安裝作業系統,硬碟重新分區不會改變HOSTID