Oracle中分區表的使用

來源:互聯網
上載者:User
oracle
 

在大型的公司專屬應用程式或企業級的資料庫應用中,要處理的資料量通常可以達到幾十到幾百GB,有的甚至可以到TB級。雖然儲存介質和資料處理技術的發展也很快,但是仍然不能滿足使用者的需求,為了使使用者的大量的資料在讀寫操作和查詢中速度更快,Oracle提供了對錶和索引進行分區的技術,以改善大型應用系統的效能。

使用分區的優點:

    1、增強可用性:如果表的某個分區出現故障,表在其他分區的資料仍然可用;

    2、維護方便:如果表的某個分區出現故障,需要修複資料,只修複該分區即可;

    3、均衡I/O:可以把不同的分區映射到磁碟以平衡I/O,改善整個系統效能;

    4、改善查詢效能:對分區對象的查詢可以僅搜尋自己關心的分區,提高檢索速度。

    Oracle資料庫提供對錶或索引的分區方法有三種:

        1、定界分割

        2、Hash分區(散列分區)

        3、複合分區

    下面將以執行個體的方式分別對這三種分區方法來說明分區表的使用。為了測試方便,我們先建三個資料表空間。

create tablespace dinya_space01
datafile '/test/demo/oracle/demodata/dinya01.dnf' size 50M

create tablespace dinya_space01
datafile '/test/demo/oracle/demodata/dinya02.dnf' size 50M

create tablespace dinya_space01
datafile '/test/demo/oracle/demodata/dinya03.dnf' size 50M

 
1         分區表的建立:1.1     定界分割
    定界分割就是對資料表中的某個值的範圍進行分區,根據某個值的範圍,決定將該資料存放區在哪個分區上。如根據序號分區,根據業務記錄的建立日期進行分區等。

    需求描述:有一個物料交易表,表名:material_transactions。該表將來可能有千萬級的資料記錄數。要求在建該表的時候使用分區表。這時候我們可以使用序號分區三個區,每個區中預計儲存三千萬的資料,也可以使用日期分區,如每五年的資料存放區在一個分區上。

根據交易記錄的序號分區建表:

SQL> create table dinya_test
  2  (
  3      transaction_id number primary key,
  4      item_id number(8) not null,
  5      item_description varchar2(300),
  6      transaction_date date  not null
  7  )
  8  partition by range (transaction_id)
  9  (
 10      partition part_01 values less than(30000000) tablespace dinya_space01,
 11      partition part_02 values less than(60000000) tablespace dinya_space02,
 12      partition part_03 values less than(maxvalue) tablespace dinya_space03
 13  );

Table created.

SQL>

建表成功,根據交易的序號,交易ID在三千萬以下的記錄將儲存在第一個資料表空間dinya_space01中,分區名為:par_01,在三千萬到六千萬之間的記錄儲存在第二個資料表空間:dinya_space02中,分區名為:par_02,而交易ID在六千萬以上的記錄儲存在第三個資料表空間dinya_space03中,分區名為par_03.

根據交易日期分區建表:

SQL> create table dinya_test
  2  (
  3      transaction_id number primary key,
  4      item_id number(8) not null,
  5      item_description varchar2(300),
  6      transaction_date date not null  
  7  )
  8  partition by range (transaction_date)
  9  (
 10  partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dinya_space01,
 11  partition part_02 values less than(to_date('2010-01-01','yyyy-mm-dd')) tablespace dinya_space02,
 12  partition part_03 values less than(maxvalue) tablespace dinya_space03
 13  );

Table created.

SQL>

這樣我們就分別建了以交易序號和交易日期來分區的分區表。每次插入資料的時候,系統將根據指定的欄位的值來自動將記錄儲存到制定的分區(資料表空間)中。

    當然,我們還可以根據需求,使用兩個欄位的範圍分布來分區,如partition by range ( transaction_id ,transaction_date),分區條件中的值也做相應的改變,請讀者自行測試。

 
1.2     Hash分區(散列分區)
    散列分區為通過指定分區編號來均勻分布資料的一種分區類型,因為通過在I/O裝置上進行散列分區,使得這些分區大小一致。如將物料交易表的資料根據交易ID散列地存放在指定的三個資料表空間中:

SQL> create table dinya_test
  2  (
  3      transaction_id number primary key,
  4      item_id number(8) not null,
  5      item_description varchar2(300),
  6      transaction_date date
  7  )
  8  partition by hash(transaction_id)
  9  (
 10      partition part_01 tablespace dinya_space01,
 11      partition part_02 tablespace dinya_space02,
 12      partition part_03 tablespace dinya_space03
 13  );

Table created.

SQL>

    建表成功,此時插入資料,系統將按transaction_id將記錄散列地插入三個分區中,這裡也就是三個不同的資料表空間中。

 
1.3        複合分區
    有時候我們需要根據定界分割後,每個分區內的資料再散列地分布在幾個資料表空間中,這樣我們就要使用複合分區。複合分區是先使用定界分割,然後在每個分區內再使用散列分區的一種分區方法,如將物料交易的記錄按時間分區,然後每個分區中的資料分三個子分區,將資料散列地儲存在三個指定的資料表空間中:

SQL> create table dinya_test
  2  (
  3      transaction_id number primary key,
  4      item_id number(8) not null,
  5      item_description varchar2(300),
  6      transaction_date date
  7  )
  8  partition by range(transaction_date)subpartition by hash(transaction_id)
  9      subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03)
 10  (
 11      partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')),
 12      partition part_02 values less than(to_date('2010-01-01','yyyy-mm-dd')),
 13      partition part_03 values less than(maxvalue)
 14  );

Table created.

SQL>

    該例中,先是根據交易日期進行定界分割,然後根據交易的ID將記錄散列地儲存在三個資料表空間中。

 
2         分區表操作
以上瞭解了三種分區表的建表方法,下面將使用實際的資料並針對按日期的定界分割來測試分區表的資料記錄的操作。
2.1     插入記錄:
SQL> insert into dinya_test values(1,12,'BOOKS',sysdate);
1 row created.
SQL> insert into dinya_test values(2,12, 'BOOKS',sysdate+30);
1 row created.
SQL> insert into dinya_test values(3,12, 'BOOKS',to_date('2006-05-30','yyyy-mm-dd'));
1 row created.
SQL> insert into dinya_test values(4,12, 'BOOKS',to_date('2007-06-23','yyyy-mm-dd'));
1 row created.
SQL> insert into dinya_test values(5,12, 'BOOKS',to_date('2011-02-26','yyyy-mm-dd'));
1 row created.
SQL> insert into dinya_test values(6,12, 'BOOKS',to_date('2011-04-30','yyyy-mm-dd'));
1 row created.
SQL> commit;
Commit complete.
SQL>

    按上面的建表結果,2006年前的資料將儲存在第一個分區part_01上,而2006年到2010年的交易資料將儲存在第二個分區part_02上,2010年以後的記錄儲存在第三個分區part_03上。
2.2     查詢分區表記錄:
SQL> select * from dinya_test partition(part_01);

TRANSACTION_ID    ITEM_ID       ITEM_DESCRIPTION            TRANSACTION_DATE
--------------------------------------------------------------------------------
             1     12            BOOKS                      2005-1-14 14:19:
             2     12            BOOKS                      2005-2-13 14:19:
SQL>

SQL> select * from dinya_test partition(part_02);

TRANSACTION_ID     ITEM_ID      ITEM_DESCRIPTION            TRANSACTION_DATE
--------------------------------------------------------------------------------
             3      12            BOOKS                       2006-5-30
             4      12            BOOKS                       2007-6-23
SQL>

SQL> select * from dinya_test partition(part_03);

TRANSACTION_ID     ITEM_ID         ITEM_DESCRIPTION      TRANSACTION_DATE
--------------------------------------------------------------------------------
             5      12               BOOKS                 2011-2-26
             6      12               BOOKS                 2011-4-30
SQL>

    從查詢的結果可以看出,插入的資料已經根據交易時間範圍儲存在不同的分區中。這裡是指定了分區的查詢,當然也可以不指定分區,直接執行select * from dinya_test查詢全部記錄。在也檢索的資料量很大的時候,指定分區會大大提高檢索速度。

 
2.3     更新分區表的記錄:
SQL> update dinya_test partition(part_01) t set t.item_description='DESK' where t.transaction_id=1;

1 row updated.

SQL> commit;

Commit complete.

SQL>

 

    這裡將第一個分區中的交易ID=1的記錄中的item_description欄位更新為“DESK”,可以看到已經成功更新了一條記錄。但是當更新的時候指定了分區,而根據查詢的記錄不在該分區中時,將不會更新資料,請看下面的例子:

 

SQL> update dinya_test partition(part_01) t set t.item_description='DESK' where t.transaction_id=6;

0 rows updated.

SQL> commit;

Commit complete.

SQL>

指定了在第一個分區中更新記錄,但是條件中限制交易ID為6,而查詢全表,交易ID為6的記錄在第三個分區中,這樣該條語句將不會更新記錄。

 
2.4     刪除分區表記錄:
SQL> delete from dinya_test partition(part_02) t where t.transaction_id=4;

 

1 row deleted.

 

SQL> commit;

 

Commit complete.

 

SQL>

 

上面例子刪除了第二個分區part_02中的交易記錄ID為4的一條記錄,和更新資料相同,如果指定了分區,而條件中的資料又不在該分區中時,將不會刪除任何資料。

 
3         分區表索引的使用:
分區表和一般表一樣可以建立索引,分區表可以建立局部索引和全域索引。當分區中出現許多事務並且要保證所有分區中的資料記錄的唯一性時採用全域索引。
3.1     局部索引分割區的建立:
SQL> create index dinya_idx_t on dinya_test(item_id)
  2  local
  3  (
  4     partition idx_1 tablespace dinya_space01,
  5     partition idx_2 tablespace dinya_space02,
  6     partition idx_3 tablespace dinya_space03
  7  );

Index created.

SQL>

看查詢的執行計畫,從下面的執行計畫可以看出,系統已經使用了索引:

SQL> select * from dinya_test partition(part_01) t where t.item_id=12;

 

Execution Plan

----------------------------------------------------------

   0      SELECT STATEMENT Optimizer=CHOOSE (Cost=2 Card=1 Bytes=187)

   1    0   TABLE ACCESS (BY LOCAL INDEX ROWID) OF 'DINYA_TEST' (Cost=

          2 Card=1 Bytes=187)

   2    1     INDEX (RANGE SCAN) OF 'DINYA_IDX_T' (NON-UNIQUE) (Cost=1

           Card=1)

Statistics

----------------------------------------------------------

          0  recursive calls

          0  db block gets

          4  consistent gets

          0  physical reads

          0  redo size

        334  bytes sent via SQL*Net to client

        309  bytes received via SQL*Net from client

          2  SQL*Net roundtrips to/from client

          1  sorts (memory)

          0  sorts (disk)

          2  rows processed

 

SQL>

 
3.2     全域索引分割區的建立。
全域索引建立時global 子句允許指定索引的範圍值,這個範圍值為索引欄位的範圍值:

SQL> create index dinya_idx_t on dinya_test(item_id)
  2  global partition by range(item_id)
  3  (
  4     partition idx_1 values less than (1000) tablespace dinya_space01,
  5     partition idx_2 values less than (10000) tablespace dinya_space02,
  6     partition idx_3 values less than (maxvalue) tablespace dinya_space03
  7  );

Index created.

SQL>

    本例中對錶的item_id欄位建立索引分割區,當然也可以不指定索引分割區名直接對整個表建立索引,如:

SQL> create index dinya_idx_t on dinya_test(item_id);

Index created.

SQL>

    同樣的,對全域索引根據執行計畫可以看出索引已經可以使用:

SQL> select * from dinya_test t where t.item_id=12;

 

Execution Plan

----------------------------------------------------------

   0      SELECT STATEMENT Optimizer=CHOOSE (Cost=2 Card=3 Bytes=561)

   1    0   TABLE ACCESS (BY GLOBAL INDEX ROWID) OF 'DINYA_TEST' (Cost

          =2 Card=3 Bytes=561)

 

   2    1     INDEX (RANGE SCAN) OF 'DINYA_IDX_T' (NON-UNIQUE) (Cost=1

           Card=3)

Statistics

----------------------------------------------------------

          5  recursive calls

          0  db block gets

         10  consistent gets

          0  physical reads

          0  redo size

        420  bytes sent via SQL*Net to client

        309  bytes received via SQL*Net from client

          2  SQL*Net roundtrips to/from client

          3  sorts (memory)

          0  sorts (disk)

          5  rows processed

 

SQL>

   
4         分區表的維護:
    瞭解了分區表的建立、索引的建立、表和索引的使用後,在應用的還要經常對分區進行維護和管理。日常維護和管理的內容包括:增加一個分區,合并一個分區及刪除分區等等。下面以定界分割為例說明增加、合并、刪除分區的一般操作:
4.1     增加一個分區:
SQL> alter table dinya_test
  2  add partition part_04 values less than(to_date('2012-01-01','yyyy-mm-dd')) tablespace dinya_spa
ce03;

Table altered.

SQL>

 

    增加一個分區的時候,增加的分區的條件必須大於現有分區的最大值,否則系統將提示ORA-14074 partition bound must collate higher than that of the last partition 錯誤。

   
4.2     合并一個分區:
SQL> alter table dinya_test merge partitions part_01,part_02 into partition part_02;

Table altered.

SQL>

    在本例中將原有的表的part_01分區和part_02分區進行了合并,合并後的分區為part_02,如果在合并的時候把合并後的分區定為part_01的時候,系統將提示ORA-14275 cannot reuse lower-bound partition as resulting partition 錯誤。

 
4.3     刪除分區:
SQL> alter table dinya_test drop partition part_01;

Table altered.

SQL>

 

    刪除分區表的一個分區後,查詢該表的資料時顯示,該分區中的資料已全部丟失,所以執行刪除分區動作時要謹慎,確保先備份資料後再執行,或將分區合并。

 
5         總結:
    需要說明的是,本文在舉例說名分區表事務操作的時候,都指定了分區,因為指定了分區,系統在執行的時候則只操作該分區的記錄,提高了資料處理的速度。不要指定分區直接操作資料也是可以的。在分區表上建索引及多索引的使用和非分區表一樣。此外,因為在維護分區的時候可能對分區的索引會產生一定的影響,可能需要在維護之後重建索引,相關內容請參考分區表索引部分的文檔。

 


相關文章

Cloud Intelligence Leading the Digital Future

Alibaba Cloud ACtivate Online Conference, Nov. 20th & 21st, 2019 (UTC+08)

Register Now >

Starter Package

SSD Cloud server and data transfer for only $2.50 a month

Get Started >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。