1.前言
隨著傳統的資料庫技術日趨成熟、電腦網路技術的飛速發展和應用範圍的擴充,資料庫應用已經普遍建立於電腦網路之上。這時集中式資料庫系統資料表現出它的不足:資料按實際需要已在網路上分布儲存,再採用集中式處理,勢必造成通訊開銷大;應用程式集中在一台電腦上運行,一旦該電腦發生故障,則整個系統受到影響,可靠性不高;集中式處理引起系統的規模和配置都不夠靈活,系統的可擴充性差。在這種形勢下,集中式DB的“集中計算”概念向“分布計算”概念發展。分布計算主要體現在客戶機/伺服器模式和分散式資料庫體繫結構兩個方面。
2.分散式資料庫系統概述
隨著傳統的資料庫技術日趨成熟、電腦網路技術的飛速發展和應用範圍的擴大,以分布式為主要特徵的資料庫系統的研究與開發受到人們的注意。分散式資料庫是資料庫技術與網路技術相結合的產物,在資料庫領域已形成一個分支。分散式資料庫的研究始於20世紀70年代中期。世界上第一個分散式資料庫系統SDD-1是由美國電腦公司CCA)於1979年在DEC電腦上實現。20世紀90年代以來,分散式資料庫系統進入商品化應用階段,傳統的關聯式資料庫產品均發展成以電腦網路及多任務作業系統為核心的分散式資料庫產品,同時分散式資料庫逐步向客戶機/伺服器模式發展。
3.DDBS的分類
1) 同構同質型DDBS:各個場地都採用同一類型的資料模型譬如都是關係型),並且是同一型號的DBMS。
2)同構異質型DDBS:各個場地採用同一類型的資料模型,但是DBMS的型號不同,譬如DB2、ORACLE、SYBASE、SQL Server等。
3)異構型DDBS:各個場地的資料模型的型號不同,甚至類型也不同。隨著電腦網路技術的發展,異種機連網問題已經得到較好的解決,此時依靠異構型DDBS就能存取全網中各種異構局部庫中的資料。
4.DDBS的特點和優缺點
DDBS的基本特點:
1)物理分布性:資料不是儲存在一個場地上,而是儲存在電腦網路的多個場地上。
邏輯整體性:資料物理分布在各個場地,但邏輯上是一個整體,它們被所有使用者全域使用者)共用,並由一個DDBMS統一管理。
2)場地自治性:各場地上的資料由本地的DBMS管理,具有自治處理能力,完成本場地的應用局部應用)。
3)場地之間協作性:各場地雖然具有高度的自治性,但是又相互協作構成一個整體。
DDBS的其他特點
1)資料獨立性
2)集中與自治相結合的控制機制
3)適當增加資料冗餘度
4)交易管理的分布性
DDBS的優點:
1)具有靈活的體繫結構
2)適應分布式的管理和控制機構
3)經濟效能優越
4)系統的可靠性高、可用性好
5)局部應用的響應速度快
5)可擴充性好,易於整合現有的系統
DDBS的缺點
1)系統開銷較大,主要花在通訊部分 。
2)複雜的存取結構如輔助索引、檔案的連結技術),在集中式DBS中是有效存取資料的重要技術,但在分布式系統中不一定有效。
3)資料的安全性和保密性較難處理。
5.資料分區
類型:
1)水平分區:按一定的條件把全域關係的所有元組劃分成若干不相交的子集,每個子集為關係的一個片段。
2)垂直分區:把一個全域關係的屬性集分成若干子集,並在這些子集上作投影運算,每個投影稱為垂直分區。
3)匯出分區:又稱為匯出水平分區,即水平分區的條件不是本關係屬性的條件,而是其他關係屬性的條件。
4)混合分區:以上三種方法的混合。可以先水平分區再垂直分區,或先垂直分區再水平分區,或其他形式,但他們的結果是不相同的。
條件:
1)完備性條件:必須把全域關係的所有資料對應到片段中,決不允許有屬於全域關係的資料卻不屬於它的任何一個片段。
2)可重構條件:必須保證能夠由同一個全域關係的各個片段來重建該全域關係。對於水平分區可用並操作重構全域關係;對於垂直分區可用聯結操作重構全域關係。
3)不相交條件:要求一個全域關係被分割後所得的各個資料片段互不重疊對垂直分區的主鍵除外)。
6.資料分配方式
1)集中式:所有資料片段都安排在同一個場地上。
2)分割式:所有資料只有一份,它被分割成若干邏輯片段,每個邏輯片段被指派在一個特定的場地上。
4)全複製式:資料在每個場地重複儲存。也就是每個場地上都有一個完整的資料副本。
5)混合式:這是一種介乎於分割式和全複製式之間的分配方式。
7.體繫結構
資料分區和資料分配概念的分離,形成了“資料分布獨立型”概念。
資料冗餘的顯式控制。資料在各個場地的分配情況在分配模式中一目瞭然,便於系統管理。
局部DBMS的獨立性。這個特徵也稱為“局部映射透明性”。此特徵允許我們在不考慮局部DBMS專用資料模型的情況下,研究DDB管理的有關問題。
8.分散式資料庫管理系統
接受使用者請求,並判定把它送到哪裡,或必須訪問哪些電腦才能滿足該要求。
訪問網路資料字典,瞭解如何請求和使用其中的資訊。
如果目標資料存放區於系統的多個電腦上,就必須進行分散式處理。
通訊介面功能。在使用者、局部DBMS和其他電腦的DBMS之間進行協調。
在一個異構型分散式處理環境中,還需提供資料和進程移植的支援。這裡的異構型是指各個場地的硬體、軟體之間存在著差別。
9.小 結
1)“分布計算”概念突破了集中式DBS的架構,資料分布使系統走上分布式DB的道路,功能分布使系統走上C/S道路。這是DBS的兩個發展。
2)C/S系統包括一個電腦網路,通常用一個區域網路連結。幾乎在所有情況下,客戶機都是微機;伺服器有時用小型機或大型主機,但多數情況下也使用微機或高檔微機。應用程式在客戶機上處理,DBMS和OS的資料管理分放在伺服器上。
3)C/S結構經曆了從兩層、三層到多層的演變過程。總的趨勢是使客戶機越來越“瘦”,變成瀏覽器;而伺服器的種類越來越多,容易實現系統的組裝。
4)C/S系統使應用與使用者更加貼近,為使用者提供較好的效能和更複雜的介面。
5)分布式系統是在集中式系統的基礎上發展而來的。DDB是資料庫技術與網路技術結合的產物。隨著電腦網路技術的飛速發展,DDBS日趨成為資料庫領域的主流方向。
6)DDB具有資料分布性和邏輯整體性的特點。DDBS能夠支援涉及多個場地的全域應用。DDB的資料存放區有資料分區和資料分配兩種策略。
7)DDB的模式結構為理解DDBS提供了一種通用的概念結構。分布透明性是DDBS追求的目標。DDBMS是負責管理分布環境下,邏輯整合資料的存取、一致性、有效性和完備性的軟體系統。
8)DDBS中資料分布在各個場地,系統中壓倒一切的效能目標是盡量減少網路中傳送資訊的次數和傳送的資料量。分散式查詢中基於半聯結的最佳化策略是常用的技術。
9)對於並發控制和恢複,DDBMS環境中會出現大量在集中式DBMS環境中碰不到的問題。分布式的並發控制有主場地方法和主拷貝方法,再輔之於備份場地技術。
(