複製是SQLServer資料庫中保持資料一致性的一種手段。根據實現策略的不同,主要有快照式複寫、事務複製、合併式複寫等三種類型。這三種複製類型,各有各的特點,分別適用於不同的場合。一般來說,在考慮採用哪種複製類型比較合適的時候,主要考慮的是效能與資料同步的時間間
複製是SQLServer資料庫中保持資料一致性的一種手段。根據實現策略的不同,主要有快照式複寫、事務複製、合併式複寫等三種類型。這三種複製類型,各有各的特點,分別適用於不同的場合。一般來說,在考慮採用哪種複製類型比較合適的時候,主要考慮的是效能與資料同步的時間間隔。那麼在什麼情形下比較適用快照式複寫呢?筆者就跟大家來討論一下這個話題。
為了在恰當的時候採用快照式複寫,資料庫管理員首先需要知道快照式複寫的特點。快照式複寫是指將資料以特定時刻的瞬時狀態轉寄,而不堅實對資料的更新。在發生同步時,將產生完整的快照並將其發送到訂閱伺服器。簡單的說,快照式複寫就是每隔一段時間發生資料同步操作。而不是發行伺服器的資料一有更新就出發這個快照式複寫。顯然這種快照式複寫的資料同步性稍微差一點。在訂閱伺服器與發行伺服器之間有一段時間會存在資料不一致的情況。但是這可以在很大程度上提高訂閱伺服器與發行伺服器的效能。這就好像汽車運輸。採用快照式複寫的話可以將一個集裝箱裝滿後在送貨,而不是有多少送多少。掌握這個資料庫複快照式複寫的具體特點之後,資料庫管理員就可以來考慮在什麼情況下,採用快照式複寫更加的合理。
一、資料更改比較少的系統中。
快照式複寫與其他複製相比最主要的缺陷就是資料庫中的資料無法及時同發行伺服器一致。為此如果發行伺服器中的內容很少更改的話,顯然此時採用快照式複寫是比較合理的。此時採用快照式複寫的話,不僅資料一致性延遲的負面效應會越來越不明顯,同時可以提高發行伺服器與訂閱伺服器的效能。如在實際工作中,經常會遇到這樣的客戶。如一家企業在各地都有辦事處或者銷售機構,就像肯德基一樣,各地的產品價格基本上都是相同的,不怎麼會更改。即使更改的話,各地也是統一調整。由於此時產品價格表更改的比較少,那麼在企業總部的資料庫服務與各地的訂閱伺服器之間,採用快照式複寫的形式就會比較合適。其實類似的情況有很多。如不少的服裝企業,像李寧、耐克等等,他們不僅自己生產,而且在各地又有自己的銷售辦事處。在價格方面也是統一的。在這種情況下,採用快照式複寫往往能夠提高資料庫複寫的效能,同時又不影響其使用。
二、在某個時段內會出現資料大量的更改。
需要補充說明的一點是,上面說到的資料不怎麼發生更改,指的是資料的延續性更改。如在一年中,每天或者每個小時更改的資料都比較平均。此時採用快照式複寫不怎麼合適。但是如果資料的更改集中在一個時段內。而其他時間中資料庫的內容不會有多大的更改。此時採用快照式複寫是可行的。如一些決策性系統,往往在起初匯入資料的時候,需要進行大量的更改。而等到資料匯入完畢,在大家對資料進行分析時,則資料庫中的內容基本上保持不變。在這種情況下,筆者認為只要資料的更新集中在一個固定的時段,此時採用快照式複寫仍然是可行的。
再如上面這個KFC或者服裝企業的案例中,如果市場部門維護一個產品的價格,而且這些價格往往在一個固定的時間進行幾次更新。如在換季的時候會進行一些促銷。此時資料庫管理員可以在資料更新完畢後立即執行複製完成的資料快照。所以,以資料更新來判斷是否適合採用快照式複寫,標準並不是資料的更新量。像上面提到的分析決策系統,其起初的資料更新量可能比有些資料庫系統幾年的資料更新量都要大。筆者認為,主要是根據資料更新的頻率來進行判斷。如果資料更新的比較頻繁,那麼即使資料更新的資料不多,像那種細水長流似的更新,則不適合採用快照式複寫。而那些井噴似的資料更新,所有的更新都集中在一個固定的時刻,那麼此時採用快照式複寫是比較合理的。
三、在一段時間內是否允許具有相對發行伺服器已淘汰的資料副本?
現在不少超市也已經連鎖了,如世紀聯華等等。為了提高利潤,增加市場的份額,這些超市紛紛推出了沖值卡,即消費者先將一定金額的人民幣打入到沖值卡中。然後每次消費完成後從卡中計費。但前些天經常有新聞報道,說一個客戶的消費卡在一家聯華超市掛失了。但是撿到這張卡的人仍然可以在其他的聯華超市中消費。為此消費者就想不明白了,為什麼掛失了的消費卡仍然可以在其他超市中消費?掛失後的損失該由誰來承擔呢?其實這就使超市在不適當的時候採用了快照式複寫所造成的。由於採用快照式複寫,在各個聯華超市的資料庫之間資料無法在短時間內取得一致。如有些商戶說掛失當日之內的損失他們不承擔,這就說明他們可能是每天下班後進行一次快照式複寫。一般情況下這不會有問題。但是像遇到消費卡被偷了等情況,就會遇到類似的問題了。
所以,在考慮是否適合採用快照式複寫的時候,還需要考慮在一段時間內是否允許具有相對發行伺服器來說已淘汰的資料副本。如果不允許的話,那麼就不允許採用這個快照式複寫。如果允許的話,那麼資料庫管理員就需要評估這段時間最長是多少。如果是24個小時,那麼就需要每隔24小時進行一次快照式複寫。但是需要注意的是,如果時間的間隔比較短,如才允許十分鐘的資料延遲,那麼採用快照式複寫就沒有必要了。此時採用事務複製或則和合併式複寫可能更加的合適。
四、複製少量的資料。
快照式複寫跟其他複製類型相比,還有一個比較顯著的特點,即當發生資料同步時,將產生完整的快照並將其從發行伺服器傳送到訂閱伺服器。這是一個什麼概念呢?如訂閱伺服器中有10G的資料,而在一個快照式複寫的周期內,只有1M的資料發生了更改。此時發生快照式複寫的話,資料庫系統會將10G的資料都傳送到訂閱伺服器上。此時更改的資料只有1M,卻需要在網路上傳送10G的資料流量,顯然會對企業的網路產生比較大的壓力。由於在發行伺服器上快照式複寫的連續開銷低於事務複製的開銷,一次資料庫系統不會啟用跟蹤增量更改。但是像這種情況,如果要複製的資料量非常的大,而平時的更新又不多。此時資料庫系統要產生和應用快照,就將耗用大量的資源,包括網路資源和伺服器資源。所以說,當發行伺服器中的資料比較多時,採用快照式複寫不怎麼合適。因為此時網路傳輸反而會成為其最重大的瓶頸資源。相反若能夠採取細水長流的事務複製策略,那麼對於商業網路效能的影響就會小的多,甚至可以忽略不計。
所以在採用快照式複寫的時候,資料庫管理員一定要明白,快照式複寫會傳送整個資料庫物件。從而在快照式複寫傳輸過程中會侵蝕大量的網路頻寬,從而明顯的降低商業網路的效能,甚至導致網路擁塞。有時候為了保障快照能夠準確、迅速的傳遞到其他的訂閱伺服器,還不得不採用VPN等技術來保障傳輸的準確性。為此,筆者認為只有發行伺服器的資料庫並不是很大的情況下,才適合採用快照式複寫。否則的話,採用快照式複寫是得不償失。
從以上的分析中,可以得到一個結論。在考慮採用快照式複寫是否合適時,往往不能夠採用一個指標來判斷。而需要考慮多個因素,如資料庫的大小、資料更新的頻率、允許資料延遲的時間等等因素來進行判斷。最後在資料的一致性與資料庫的效能之間取得一個均衡。說實話,對於大部分資料庫管理員來說,要做出一個抉擇,確實有困難。因為這沒有固定的指標可以拿來參考。如資料庫容量小於多少時該採用快照式複寫。任何一個資料庫管理專家都不能夠下這個結論。所以在掌握影響其選擇的相關因素外,就要依靠資料庫管理員的經驗了。在遇到類似的選擇題時,往往經驗可以協助管理員迅速解決問題。最後需要提醒的是,無論最終採取了什麼方案,最好能夠持續跟蹤一段時間,看看自己的選擇是否合理。