[轉]資料庫分區

來源:互聯網
上載者:User

標籤:

此文從以下幾個方面來整理關於分區表的概念及操作: 
        1.資料表空間及分區表的概念 
        2.表分區的具體作用 
        3.表分區的優缺點 
        4.表分區的幾種類型及操作方法 
        5.對錶分區的維護性操作. 
(1.) 資料表空間及分區表的概念 
資料表空間: 
  是一個或多個資料檔案的集合,所有的資料對象都存放在指定的資料表空間中,但主要存放的是表, 所以稱作資料表空間。 

分區表: 
當表中的資料量不斷增大,查詢資料的速度就會變慢,應用程式的效能就會下降,這時就應該考慮對錶進行分區。表進行分區後,邏輯上表仍然是一張完整的表,只是將表中的資料在物理上存放到多個資料表空間(物理檔案上),這樣查詢資料時,不至於每次都掃描整張表。 

( 2).表分區的具體作用 
Oracle的表資料分割函數通過改善可管理性、效能和可用性,從而為各式應用程式帶來了極大的好處。通常,分區可以使某些查詢以及維護操作的效能大大提高。此外,分區還可以極大簡化常見的管理工作,分區是構建千MB資料系統或超高可用性系統的關鍵工具。 

資料分割函數能夠將表、索引或索引組織表進一步細分為段,這些資料庫物件的段叫做分區。每個分區有自己的名稱,還可以選擇自己的儲存特性。從資料庫管理員的角度來看,一個分區後的對象具有多個段,這些段既可進行集體管理,也可單獨管理,這就使資料庫管理員在管理分區後的對象時有相當大的靈活性。但是,從應用程式的角度來看,分區後的表與非分區表完全相同,使用 SQL DML 命令訪問分區後的表時,無需任何修改。 

什麼時候使用分區表: 
1、表的大小超過2GB。 
2、表中包含曆史資料,新的資料被增加都新的分區中。 

(3).表分區的優缺點 
表分區有以下優點: 
1、改善查詢效能:對分區對象的查詢可以僅搜尋自己關心的分區,提高檢索速度。 
2、增強可用性:如果表的某個分區出現故障,表在其他分區的資料仍然可用; 
3、維護方便:如果表的某個分區出現故障,需要修複資料,只修複該分區即可; 
4、均衡I/O:可以把不同的分區映射到磁碟以平衡I/O,改善整個系統效能。 

缺點: 
分區表相關:已經存在的表沒有方法可以直接轉化為分區表。不過 Oracle 提供了線上重定義表的功能。 

(4).表分區的幾種類型及操作方法 
一.定界分割: 
定界分割將資料基於範圍映射到每一個分區,這個範圍是你在建立分區時指定的分區鍵決定的。這種分區方式是最為常用的,並且分區鍵經常採用日期。舉個例子:你可能會將銷售資料按照月份進行分區。 
當使用定界分割時,請考慮以下幾個規則: 
1、每一個分區都必須有一個VALUES LESS THEN子句,它指定了一個不包括在該分區中的上限值。分區鍵的任何值等於或者大於這個上限值的記錄都會被加入到下一個高一些的分區中。 
2、所有分區,除了第一個,都會有一個隱式的下限值,這個值就是此分區的前一個分區的上限值。 
3、在最高的分區中,MAXVALUE被定義。MAXVALUE代表了一個不確定的值。這個值高於其它分區中的任何分區鍵的值,也可以理解為高於任何分區中指定的VALUE LESS THEN的值,同時包括空值。 
例一: 
假設有一個CUSTOMER表,表中有資料200000行,我們將此表通過CUSTOMER_ID進行分區,每個分區儲存100000行,我們將每個分區儲存到單獨的資料表空間中,這樣資料檔案就可以跨越多個物理磁碟。下面是建立表和分區的代碼,如下: 
CREATE TABLE CUSTOMER 

    CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY, 
    FIRST_NAME  VARCHAR2(30) NOT NULL, 
    LAST_NAME   VARCHAR2(30) NOT NULL, 
    PHONE        VARCHAR2(15) NOT NULL, 
    EMAIL        VARCHAR2(80), 
    STATUS       CHAR(1) 

PARTITION BY RANGE (CUSTOMER_ID) 

    PARTITION CUS_PART1 VALUES LESS THAN (100000) TABLESPACE CUS_TS01, 
    PARTITION CUS_PART2 VALUES LESS THAN (200000) TABLESPACE CUS_TS02 

例二:按時間劃分 
CREATE TABLE ORDER_ACTIVITIES 

    ORDER_ID      NUMBER(7) NOT NULL, 
    ORDER_DATE    DATE, 
    TOTAL_AMOUNT NUMBER, 
    CUSTOTMER_ID NUMBER(7), 
    PAID           CHAR(1) 

PARTITION BY RANGE (ORDER_DATE) 

  PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE(‘01- MAY -2003‘,‘DD-MON-YYYY‘)) TABLESPACEORD_TS01, 
  PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE(‘01-JUN-2003‘,‘DD-MON-YYYY‘)) TABLESPACE ORD_TS02, 
  PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE(‘01-JUL-2003‘,‘DD-MON-YYYY‘)) TABLESPACE ORD_TS03 

例三:MAXVALUE 
CREATE TABLE RangeTable 

  idd   INT PRIMARY KEY , 
  iNAME VARCHAR(10), 
  grade INT  

PARTITION  BY  RANGE (grade) 

      PARTITION  part1 VALUES  LESS  THEN (1000) TABLESPACE  Part1_tb, 
      PARTITION  part2 VALUES  LESS  THEN (MAXVALUE) TABLESPACE  Part2_tb 
); 

二.列表分區: 
該分區的特點是某列的值只有幾個,基於這樣的特點我們可以採用列表分區。 
例一 
CREATE TABLE PROBLEM_TICKETS 

    PROBLEM_ID   NUMBER(7) NOT NULL PRIMARY KEY, 
    DESCRIPTION  VARCHAR2(2000), 
    CUSTOMER_ID  NUMBER(7) NOT NULL, 
    DATE_ENTERED DATE NOT NULL, 
    STATUS       VARCHAR2(20) 

PARTITION BY LIST (STATUS) 

      PARTITION PROB_ACTIVE   VALUES (‘ACTIVE‘) TABLESPACE PROB_TS01, 
      PARTITION PROB_INACTIVE VALUES (‘INACTIVE‘) TABLESPACE PROB_TS02 
例二 
CREATE  TABLE  ListTable 

    id    INT  PRIMARY  KEY , 
    name  VARCHAR (20), 
    area  VARCHAR (10) 

PARTITION  BY  LIST (area) 

    PARTITION  part1 VALUES (‘guangdong‘,‘beijing‘) TABLESPACE  Part1_tb, 
    PARTITION  part2 VALUES (‘shanghai‘,‘nanjing‘)  TABLESPACE  Part2_tb 
); 


三.散列分區: 
這類分區是在列值上使用散列演算法,以確定將行放入哪個分區中。當列的值沒有合適的條件時,建議使用散列分區。 
散列分區為通過指定分區編號來均勻分布資料的一種分區類型,因為通過在I/O裝置上進行散列分區,使得這些分區大小一致。 
例一: 
CREATE TABLE HASH_TABLE 

  COL NUMBER(8), 
  INF VARCHAR2(100) 

PARTITION BY HASH (COL) 

  PARTITION PART01 TABLESPACE HASH_TS01, 
  PARTITION PART02 TABLESPACE HASH_TS02, 
  PARTITION PART03 TABLESPACE HASH_TS03 

簡寫: 
CREATE TABLE emp 

    empno NUMBER (4), 
    ename VARCHAR2 (30), 
    sal   NUMBER 

PARTITION BY  HASH (empno) PARTITIONS 8 
STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8); 

hash分區最主要的機制是根據hash演算法來計算具體某條紀錄應該插入到哪個分區中,hash演算法中最重要的是hash函數,Oracle中如果你要使用hash分區,只需指定分區的數量即可。建議分區的數量採用2的n次方,這樣可以使得各個分區間資料分布更加均勻。 

四.組合範圍散列分區 
這種分區是基於定界分割和列表分區,表首先按某列進行定界分割,然後再按某列進行列表分區,分區之中的分區被稱為子分區。 
CREATE TABLE SALES 

PRODUCT_ID VARCHAR2(5), 
SALES_DATE DATE, 
SALES_COST NUMBER(10), 
STATUS VARCHAR2(20) 

PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS) 

   PARTITION P1 VALUES LESS THAN(TO_DATE(‘2003-01-01‘,‘YYYY-MM-DD‘))TABLESPACE rptfact2009 
          ( 
              SUBPARTITION P1SUB1 VALUES (‘ACTIVE‘) TABLESPACE rptfact2009, 
              SUBPARTITION P1SUB2 VALUES (‘INACTIVE‘) TABLESPACE rptfact2009 
          ), 
   PARTITION P2 VALUES LESS THAN (TO_DATE(‘2003-03-01‘,‘YYYY-MM-DD‘)) TABLESPACE rptfact2009 
          ( 
              SUBPARTITION P2SUB1 VALUES (‘ACTIVE‘) TABLESPACE rptfact2009, 
              SUBPARTITION P2SUB2 VALUES (‘INACTIVE‘) TABLESPACE rptfact2009 
          ) 


五.複合範圍散列分區: 
這種分區是基於定界分割和散列分區,表首先按某列進行定界分割,然後再按某列進行散列分區。 
create table dinya_test 

transaction_id number primary key, 
item_id number(8) not null, 
item_description varchar2(300), 
transaction_date date 

partition by range(transaction_date)subpartition by hash(transaction_id)  subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03) 

     partition part_01 values less than(to_date(‘2006-01-01’,’yyyy-mm-dd’)), 
     partition part_02 values less than(to_date(‘2010-01-01’,’yyyy-mm-dd’)), 
     partition part_03 values less than(maxvalue) 
); 

[轉]資料庫分區

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.