一.背景
我們知道,當資料庫中的資料量越來越大時,不論是讀還是寫 ,壓力都會變得越來越大。採用MySQL Replication多master多slave方案,在上 層做負載平衡,雖然能夠一定程度上緩解壓力。但是當一張表中的資料變得非常 龐大時,壓力還是非常大的。試想,如果一張表中的資料量達到了千萬甚至上億 層級的時候,不管是建索引,最佳化緩衝等,都會面臨巨大的效能壓力。
二 .定義
資料sharding,也稱作資料切分,或分區。是指通過某種條件,把 同一個資料庫中的資料分散到多個資料庫或多台機器上,以減小單台機器壓力。
三.分類
資料分區根據切分規則,可以分為兩類:
(1)垂直 分區:以表為單位,把不同的表分散到不同的資料庫或主機上。特點是規則簡單 ,實施方便,適合業務之間耦合度低的系統。
(2)水平資料分割:以行為單位 ,將同一個表中的資料按照某種條件拆分到不同的資料庫或主機上。特點是相對 複雜,適合單表巨大的系統。
在實際情況中,有的時候把垂直資料分割和水平 分區結合使用。
四.示意圖
下面通過幾張圖來給出上面三種分區方 式的直觀效果。
(1)垂直資料分割
(2)水平資料分割
(3)聯合分區
五.注意事項
下面我們所說的分區,主要是指水 平分區。
(1)在實施分區前,我們可以查看所安裝版本的mysql是否支援分 區:
mysql> show variables like "%partition%";
如果支援則會顯示:
+-------------------+-------+
| Variable_name | Value |
+-------------------+----- --+
| have_partitioning | YES |
+------------------ -+-------+
(2)分區適用於一個表的所有資料和索引;不能只對資料分區而 不對索引分割區,反之亦然,同時也不能只對錶的一部分進行分區。
(3)分 區類型:
RANGE 分區:基於屬於一個給定連續區間的列值,把多行分配給 分區。
LIST 分區:類似於按RANGE分區,區別在於LIST分區是基於列值匹 配一個離散值集合中的某個值來進行選擇。
HASH分區:基於使用者定義的表 達式的傳回值來進行選擇的分區,該運算式使用將要插入到表中的這些行的列值 進行計算。
KEY 分區:類似於按HASH分區,區別在於KEY分區只支援計算 一列或多列,且MySQL 伺服器提供其自身的雜湊函數。必須有一列或多列包含整 數值。
無論使用何種類型的分區,分區總是在建立時就自動的順序編號, 且從0開始記錄。當有一新行插入到一個分區表中時,就是使用這些分區編號來識 別正確的分區。
(4) MySQL提供了許多修改分區表的方式。添加、刪除、 重新定義、合并或拆分已經存在的分區是可能的。所有這些操作都可以通過使用 ALTER TABLE 命令的分區擴充來實現.
(5) 可以對已經存在的表進行分區 ,直接使用alter table命令即可。