我們推薦本文的讀者已經閱讀並且理解以下的文章:
◆使用一個Microsoft SQL Server 2000資料倉儲中的分區- http://msdn.microsoft.com/library/default.asp?URL=/library/techart/PartitionsInDW.htm
◆SQL Server 2000 步進的大量匯入案例學習 - http://www.microsoft.com/technet/prodtechnol/sql/2000/maintain/incbulkload.mspx
◆Kimberly L. Tripp 所作的SQL Server 2005 分區表和索引 -
http://www.sqlskills.com/resources/Whitepapers/Partitioning%20in%20SQL%20Server%202005%20Beta%20II.htm
本白皮書關注的重點是關係型資料倉儲和表分區。它的目標讀者是:
◆通過使用Microsoft SQL Server中的分區視圖實現了分區的開發人員和資料庫管理員。這類讀者將會得益於SQL Server 2005中的分區優勢以及關於滑動視窗實現和策略的部份。
◆在未來計劃使用分區的開發人員和資料庫管理員將會通過詳細閱讀本白皮書而獲益非淺。
資料庫和系統管理員將會得益於有關儲存網域網路管理以及最佳化I/O利用策略的部份。
內容列表
對一個關係型資料倉儲進行分區
關於關係型資料倉儲
分區的好處
在 SQL Server 7.0/2000中的分區技術
在SQL Server 2005中的分區技術
在SQL Server 2005中分區的優勢
標識一個查詢計劃中的 Demand Parallelism
從SQL Server 2000的分區視圖遷移到 SQL Server 2005 分區表/索引
影響關係型資料倉儲分區的因素
資料量
資料匯入
索引
資料老化
資料存檔
查詢效能
滑動視窗實現
交換分區的最佳實務
將資料存放區到一個性價比高I/O子系統的技術
關係型資料倉儲的分區策略
策略 I – 將一個分區綁定到它自己的檔案組
策略Strategy II – 將兩個或更多分區綁定到同樣的檔案組
哪個策略更好?
結論
附錄 A: 效能數值
批量插入效能
轉換效能
索引構建效能
Database Backup效能
老化資料到ATA 磁碟
附錄 B: 平台列表
Microsoft 軟體
伺服器平台
儲存
主機匯流排適配卡
儲存管理軟體
附錄 C: 伺服器體繫結構
附錄 D: EMC CLARiiON 儲存
拓樸
附錄 E: 儲存隔離
配置你的儲存
附錄 F: 指令碼
對一個關係型資料倉儲進行分區
以下的部份將會簡要的解釋關係型資料倉儲的概念,為關係型資料倉儲進行分區的好處,以及遷移到Microsoft® SQL Server™ 2005分區的好處。
關於關係型資料倉儲
關係型資料倉儲提供了一個廣泛的資料來源以及一個用來構建業務智能BI)解決方案的體繫結構。另外,關係型資料倉儲可以為報表應用程式以及複雜且專用的SQL查詢所用。
一個典型的關係型資料倉儲是由維度資料表以及事實表組成的。維度資料表通常會比事實表小一些並且其中提供了關於解釋事實的屬性的詳細資料。一個維度例子是貨物,商店和時間。事實表提供了對商業記錄的描述,比如在所有商店中貨物銷售的資訊。事實表通過最近收集到的資料進行不斷的更新。
一個成功的關係型資料倉儲解決方案的實現包括細緻而長期的規劃。以下列出了在構建一個關係型資料倉儲時要考慮的要素:
◆資料量
◆資料匯入視窗
◆索引維護視窗
◆工作負載特徵
◆資料老化策略
◆存檔和備份策略
◆硬體特徵
這個文檔後面的部份將會有對以上要素的詳細討論。
一個關係型資料倉儲在實現時可以採用分區的方法或者一個巨大)事實表的方法。對於使用分區還是不分區方式的設計選擇主要依賴於前面列出的各個要素。關係型資料倉儲可以從資料分區中獲益。以下部份著重談到了分區為關係型資料倉儲帶來的好處。