談一下如何設計Oracle 分區表

來源:互聯網
上載者:User

在談設計Oracle分區表之間先區分一下分區表和資料表空間的個概念:

資料表空間:資料表空間是一個或多個資料檔案的集合,所有資料對象都存放在指定的資料表空間中,但主要存放表,故稱資料表空間。

分區表:分區致力於解決支援極大表和索引的關鍵問題。它採用他們分解成較小和易於管理的稱為分區的片(piece)的方法。一旦分區被定義,SQL語句就可以訪問的操作某一個分區而不是整個表,因而提高管理的效率。分區對於資料倉儲應用程式非常有效,因為他們常常儲存和分析巨量的曆史資料。當表中的資料量不斷增大,查詢資料的速度就會變慢,應用程式的效能就會下降,這時就應該考慮對錶進行分區。表進行分區後,邏輯上表仍然是一張完整的表,只是將表中的資料在物理上存放到多個資料表空間(物理檔案上),這樣查詢資料時,不至於每次都掃描整張表。

表分區的具體作用:

    Oracle的分區表功能通過改善可管理性、效能和可用性,從而為各式應用程式帶來了極大的好處。

    通常,分區可以使某些查詢以及維護操作的效能大大提高。此外,分區還可以極大簡化常見的管理工作,分區是構建千MB資料系統或超高可用性系統的關鍵工具。

     資料分割函數能夠將表、索引或索引組織表進一步細分為段,這些資料庫物件的段叫做分區。每個分區有自己的名稱,還可以選擇自己的儲存特性。從資料庫管理員的角度來看,一個分區後的對象具有多個段,這些段既可進行集體管理,也可單獨管理,這就使資料庫管理員在管理分區後的對象時有相當大的靈活性。但是,從應用程式的角度來看,分區後的表與非分區表完全相同,使用 SQL DML 命令訪問分區後的表時,無需任何修改。

在什麼時候使用分區表呢?

    1、表的大小超過2GB。

    2、表中包含曆史資料,新的資料被增加都新的分區中。

表分區的優缺點:

    優點:

    1、改善查詢效能:對分區對象的查詢可以僅搜尋自己關心的分區,提高檢索速度。

    2、增強可用性:如果表的某個分區出現故障,表在其他分區的資料仍然可用;

    3、維護方便:如果表的某個分區出現故障,需要修複資料,只修複該分區即可;

    4、均衡I/O:可以把不同的分區映射到磁碟以平衡I/O,改善整個系統效能。

    缺點:

    1、分區表相關:已經存在的表沒有方法可以直接轉化為分區表。不過 Oracle 提供了線上重定義表的功能。

    2、分區致力於解決支援極大表和索引的關鍵問題。它採用他們分解成較小和易於管理的稱為分區的片(piece)的方法。

分區表的分類 

    1、Range partitioning(定界分割) 
    2、Hash partitioning(雜湊分割) 
    3、List partitioning(列表分區) 
    4、Composite range-hash partitioning(範圍-雜湊組合分區) 
    5、 Composite range-list partitioning(範圍-列表組合分區)

何時選擇定界分割 
    必須可以將表的記錄按照某一列值的範圍進行劃分。你想處理一些資料,這些資料經常是屬於某一個範圍內,例如月份。如果資料能夠按照分區的範圍均勻分布的話,那會獲得最佳效能。如果資料分布很不均勻的話,你可能不得不選擇其他分區方式。

CREATE TABLE sales ( invoice_no NUMBER, sale_year INT NOT NULL, sale_month INT NOT NULL, sale_day INT NOT NULL ) PARTITION BY RANGE (sale_year, sale_month, sale_day) ( PARTITION sales_q1 VALUES LESS THAN (1999, 04, 01) TABLESPACE tsa, PARTITION sales_q2 VALUES LESS THAN (1999, 07, 01) TABLESPACE tsb, PARTITION sales_q3 VALUES LESS THAN (1999, 10, 01) TABLESPACE tsc, PARTITION sales_q4 VALUES LESS THAN (2000, 01, 01) TABLESPACE tsd );

 

何時選擇HASH分區 
如果資料不容易用定界分割,但你想提升效能和表的易管理性。 Hash分區提供了一個在指定數量的分區內交叉均勻分布資料的方法。行根據分區鍵的hash值映射到相應分區中。建立和使用hash分區你可以靈活放置資料,可以通過交叉訪問在不同I/O裝置上的分區提升效能。

CREATE TABLE scubagear (id NUMBER, name VARCHAR2 (60)) PARTITION BY HASH (id) PARTITIONS 4 STORE IN (gear1, gear2, gear3, gear4);

 

何時挑選清單分區 
使用LIST分區你可以直接控制某些資料對應到某些分區。你可以為某個分區指定不連續的分區鍵值。這不同於RANGE分區(用鍵值的範圍劃分分區),也不同於HASH分區(不能控制某行映射到哪個分區)。

CREATE TABLE q1_sales_by_region (deptno number, deptname varchar2(20), quarterly_sales number(10, 2), state varchar2(2)) PARTITION BY LIST (state) (PARTITION q1_northwest VALUES ('OR', 'WA'), PARTITION q1_southwest VALUES ('AZ', 'UT', 'NM'), PARTITION q1_northeast VALUES ('NY', 'VM', 'NJ'), PARTITION q1_southeast VALUES ('FL', 'GA'), PARTITION q1_northcentral VALUES ('SD', 'WI'), PARTITION q1_southcentral VALUES ('OK', 'TX'));

分區表的設計 
如何選擇分區的類型,如何選擇分區的列呢?在這之前你必須明確你的目的——易管理性和效能,你更注重哪個方面?分區表所影響的方面可以歸類為以下幾種:效能、易管理性、資料清理。 
下面分別說說分區表對每一項的具體影響, 
效能: 
這一般是分區的主要目的。分區將大表變成了小表,當where之後的條件體現分區欄位的具體值時,避免了全表掃描。 
易於管理: 
對於包含海量資料的大表,分區帶來的易於管理性是非常明顯的。當你建議一個基於非分區表的索引時,唯一的選擇就是建立整個索引。如果表被分區,你就可以根據分區並行為此表建立索引,例如:

alter index par_ind_01 reuild partition yy05; 

除此之外你還可以同時的做很多事情,像改變表所在資料表空間、匯出表,刪除表資料等等。


刪除資料: 
我們經常會需要刪除表的一些曆史資料,一般做法是delete,但是這會導致undo和redo的資訊快速增長,而且影響資料庫整體效能。這時我們就可以利用drop某個分區來完成此任務,例如:

alter table tab_a drop partition yy01; 

當一個表的分區被刪除,對應的local索引也同時被刪除。如果還存在著global索引,那麼它會變成unusable狀態。為了避免此事情的發生,你可以使用:

alter table tab_a drop partition yy01 update global indexes; 

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.