mysql分表規則

來源:互聯網
上載者:User

標籤:script   類型   梯度   屬性   tail   foreign   複雜   說明   details   

author:skate
time:2013/05/14


Mysql分表準則

在大量使用mysql時,資料量大、高訪問時,為了提高效能需要分表處理,簡介下mysql分表的標準,後續會繼續補充

 

環境:
業務類型:OLTP
硬體:
cpu:8cpu 2.4GHZ
mem:48G
磁碟:raid5 6×sas

 

什麼樣的表需要拆分:根據表的體積、表的行數、訪問特點來衡量表是否需要拆分

一.拆分標準是:
  1.表的體積大於2G或行數大於1000w,以單表主鍵等簡單形式訪問資料,這個時候需要分表
  2.表的體積大於2G或行數大於500W,以兩表jion,小範圍查詢(結果集小100行)等形式訪問資料,這個時候需要分表
  3.表的體積大於2G或行數大於200w,以多表join,範圍查詢,order by,group by,高頻率等複雜形式訪問資料,尤其DML,這個時候需要分表
  4.表的欄位中含有text等大欄位的、varchar(500)以上的、很少使用的字元型欄位拆分成父子表,這種分表可以和以上聯合使用
  5.資料有時間到期特性的,需要做資料分表歸檔處理

 

只要達到上面任何一個標準,都需要做分表處理

 

二.分表方法:
  1.冷熱資料分表:適用小訪問量,冷資料很少使用
     1.1 單表欄位很多,把頻繁使用整型欄位的和非頻繁使用的字元型欄位或大欄位拆到兩個表中
     1.2 表資料具有時間到期性,把到期資料拆分到曆史表裡或者按時間梯度分表
  2.橫向分表:適用大訪問量
     2.1 如雜湊等分切表或其他基於對某數字取餘的切表,優點是方便資料分布,缺點是無法再擴充
     2.2 按主鍵id遞增分表,比如每100w個id一個分表,優點是方便擴充,缺點是壓力不均
     2.3 按日期分表,比如每天、每月、每年一個分表,優點是方便擴充,缺點是壓力不均
      
說明
1.表的體積如何預估
CREATE TABLE `td_skate` (
      `valid` BIGINT(20) NOT NULL AUTO_INCREMENT COMMENT ‘值id‘,
      `propertyid` BIGINT(20) NULL DEFAULT NULL COMMENT ‘屬性id‘,
      `text` VARCHAR(400) NULL DEFAULT NULL,
      `entext` VARCHAR(400) NULL DEFAULT NULL,
      `picurl` VARCHAR(200) NULL DEFAULT NULL COMMENT ‘屬性值說明圖片,儲存圖片相對位址‘,
      `isother` BIGINT(20) NULL DEFAULT NULL COMMENT ‘是否是other值, 0  否  1  是‘,
      `createtime` DATETIME NULL DEFAULT NULL COMMENT ‘建立時間‘,
      `createuser` BIGINT(20) NULL DEFAULT NULL COMMENT ‘建立使用者‘,
      `lastmodify` DATETIME NULL DEFAULT NULL COMMENT ‘最後修改時間‘,
      `updatetimeuser` BIGINT(20) NULL DEFAULT NULL COMMENT ‘最後修改人‘,
      `deletetime` DATETIME NULL DEFAULT NULL COMMENT ‘刪除時間‘,
      `deleteuser` BIGINT(20) NULL DEFAULT NULL COMMENT ‘刪除人‘,
      `description` VARCHAR(4000) NULL DEFAULT NULL COMMENT ‘產品描述‘,
      `isdelete` INT(11) NULL DEFAULT ‘0‘,
      PRIMARY KEY (`valid`),
      INDEX `fk_td_prodline_attrval_td_prodline_attr` (`propertyid`),
      CONSTRAINT `fk_td_prodline_attrval_td_prodline_attr` FOREIGN KEY (`propertyid`) REFERENCES `td_prodline_attr` (`propertyid`)
)
COLLATE=‘utf8_general_ci‘
ENGINE=InnoDB
AUTO_INCREMENT=2491650;


把表的所有欄位佔用位元組數相加,再乘以預估行數就是表的體積,比如上面的表,預估有1000W,那他的體積是
(8+8+400+400+200+8+8+8+8+8+8+8+4000+8)×10000000=50.8G,可以看到這個表設計非常不合理,可以修改如下:

int替代bigint
timestamp替代datetime
狀態位isdelete用tinyint替代
根據業務特點看能否把varchar(4000)放到一個字表中

最佳化後表大小:(4+4+400+400+200+4+4+4+4+4+4+4+1)×10000000=10.37G,如果要進一步提升效能,需要刪除外鍵,分表,保證單表在2G以下。
如果需要查看description資訊,通過主鍵關聯查看子表,只會掃描有效子表資訊, 效能將會提升非常大。  


2.表的行數預估就很簡單,根據業務特點,訪問量等預估

mysql的整數型別有這樣幾種:
類型 佔用位元組
tinyint 1
smallint 2
mediumint 3
int 4
bigint 8
這是決定儲存需要佔用多少位元組
tinyint(M), M預設為4;
SMALLINT(M), M預設為6;
MEDIUMINT(M), M預設為9;
INT(M),M預設為11;
BIGINT(M),M預設為20.

轉載地址:http://blog.csdn.net/wyzxg/article/details/8930658

mysql分表規則(轉)

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.