伺服器集群技術深入瞭解探密

來源:互聯網
上載者:User
關鍵字 nbsp; 伺服器 故障 磁片 提供

在發展初期,一路處理器便可為一台伺服器及其所有應用提供動力。 接著就發展到了多處理時代,這時兩路或多路處理器共用一個存儲池,並能處理更多更大的應用。 然後出現了伺服器網路,該網路中的每台伺服器都專門處理不同的應用集。 現在,發展到了伺服器集群,兩台或多台伺服器像一台伺服器一樣工作,提供更高的可用性和性能,這已經遠遠超出了您的想像。 應用可從一台伺服器轉移到另一台伺服器,或同時運行在若干台伺服器上――所有這一切對使用者都是透明的。
&HTTP://www.aliyun.com/zixun/aggregation/37954.html">nbsp;   集群並不是新事物,但在軟體和硬體方面,直到最近它們還是專有的。 資訊系統經理對集群進行了更加仔細的考慮,這是因為現在他們可以使用大規模生產的標準硬體實現集群,如RAID、對稱多處理系統、網路和I/O網卡及外設。 集群技術在未來將會獲得更大的發展,現在,不斷推出新的集群選件,而真正的集群標準尚在制定之中。

何為集群?

簡單的說,集群就是兩台或多台電腦或節點在一個群組內共同工作。 與 單獨工作的電腦相比,集群能夠提供更高的可用性和可擴充性。 集群中的每個節點通常都擁有自己的資源(處理器、I/O、記憶體、作業系統、儲存體),並對自己的使用者集負責。

故障切換功能提供絲捎眯裕旱幣桓黿詰惴⑸?收鮮保?渥試茨芄?quot;切換"到集群中一個或多個其它節點上。 一旦發生故障的節點恢復全面運行,通過前瞻性地將一台伺服器的功能"切換"到集群中其它伺服器上,可以實現升級,停止該伺服器的運行以增加元件,然後將其放回到集群中,再將其功能從其它伺服器轉回該伺服器。 利用分散式訊息傳遞(DMP)可提供額外的可擴充性,DMP是一種集群內通信技術,該技術允許應用以對最終使用者透明的方式擴展到單個對稱多處理(SMP)系統以外。

集群中的每個節點必須運行集群軟體以提供服務,如故障檢測、恢復和將伺服器作為約 個系統進行管理的能力。 集群中的節點必須以一種知道所有其它節點狀態的方式連接。 這通常通過一條由於局域網路徑相分離的通訊路徑來實現,並使用私人網路卡來確保節點間清楚的通信。 該通訊路徑中繼系統間的一?quot;心跳",這樣,如果一個資源發生故障因而無法發送心跳,就會開始故障切換過程。 實際上,最可靠的配置採用了使用不同通信連接(局域網、SCSI和RS232)的冗余心跳,以確保通信故障不會啟動錯誤的故障切換。

集群級別

今天,對於集群購買者來說,幸運的是有多款不同檔次的集群可供選擇,它們可提供廣泛的可用性。 當然,可用性越高,價格也越高,管理複雜性也越大。

共用存儲

共用磁片子系統往往是集群的基礎、它使用共用的SCSI或光纖通道。 每個節點使用其本地磁片存儲作業系統交換空間和系統檔,而應用資料存儲在共用磁片上,每個節點均可讀取由其它節點寫入的資料。 應用間的併發磁片訪問需要分佈鎖定管理器(DLM),而且共用磁片子系統與其集群節點之間的距離會受到所選擇介質(SCSI或光纖通道等)的限制。

伺服器鏡像(鏡像磁片)

需要資料冗余而又無需佔用額外磁片子系統的環境有權選擇伺服器間的鏡像資料。 除了成本更低以外,伺服器鏡像的另一個優勢是,在主機板伺服器與次要伺服器之間的連接可以是基於局域網的,這樣就消除了SCSI 距離限制。 資料寫到主機板伺服器上後,它還寫到了輔伺服器上;通過鎖定伺服器資料保持了資料的完整性。 一些伺服器鏡像產品還可將工作負載從主伺服器轉換到輔伺服器上。

非共用

現在,一些集群產品使用的是"非共用"體系結構,在此體系結構中,節點既不共用集中式磁片,也不在節點間鏡像資料。 發生故障時,非共用集群所具有的軟體能夠將磁片擁有權從一個節點傳送至另一個節點,而無需使用分散式分散式鎖定管理器(DLM)。

如何實現故障切換?

可以使用多種方法配製集群實現故障切換。 第一種方法是N路配製,集群中的所有節點在正常情況下都擁有自己的使用者和工作負載。 一個故障節點的資源可切換到其它節點,但由於剩餘的伺服器承擔了額外的負載,因此其性能將有所下降。

N+1配製包括一個熱待機系統,它在主系統發生故障之前一直處於空閒模式。 在N+1配製中,當一個節點發生故障時可避免其它節點的性能下降。 但是,由於待機節點在正常情況下並不提供服務,因而成本較高。

在任何配製中,一旦出現問題,集群軟體將能夠首先進行本地恢復。 本地恢復即在發生故障時,在本地節點自動重新開機應用或服務的能力。 對節點並非致命的故障來說,邏輯上本地恢復是首選方式,因為與切換至另一個節點相比,它對使用者的中斷更少。

就故障切換的種類而論,一些集群產品可進行並行恢復,其中資源能夠故障切換到不同地區的遠端節點上。 這很適合於容災需求。 次外,為了解決多個節點故障問題,一些集群產品可以進行級聯故障切換,其工作方式就像多米諾骨牌一樣:節點一故障切換到節點二,節點二發生故障後再切換到節點三等等。

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.