1、MyCat概念
1.1 總體架構
MyCAT的架構如下圖所示:
MyCAT使用MySQL的通訊協議類比成一個MySQL伺服器,並建立了完整的Schema(資料庫)、Table(資料表)、User(使用者)的邏輯模型,並將這套邏輯模型映射到後端的儲存節點DataNode(MySQL Instance)上的真實物理庫中,這樣一來,所有能使用MySQL的用戶端以及程式設計語言都能將MyCAT當成是MySQLServer來使用,不必開發新的用戶端協議。
當MyCAT收到一個用戶端發送的SQL請求時,會先對SQL進行文法分析和檢查,分析的結果用於SQL路由,SQL路由策略支援傳統的基於表格的分區欄位方式進行分區,也支援專屬的基於資料庫E-R關係的分區策略,對於路由到多個資料節點(DataNode)的SQL,則會對收到的資料集進行“歸併”然後輸出到用戶端。
SQL執行的過程,簡單的說,就是把SQL通過網路通訊協定發送給後端的真正的資料庫上進行執行,對於MySQL Server來說,是通過MySQL網路通訊協定發送報文,並解析返回的結果,若SQL不涉及到多個分區節點,則直接返回結果,寫入用戶端的SOCKET流中,這個過程是非阻塞模式(NIO)。
DataNode是MyCAT的邏輯資料節點,映射到後端的某一個物理資料庫的一個Database,為了做到系統高可用,每個DataNode可以配置多個引用地址(DataSource),當主DataSource被檢測為不可用時,系統會自動切換到下一個可用的DataSource上,這裡的DataSource即可認為是Mysql的主從伺服器的地址。 1.2 邏輯庫
與任何一個傳統的關係型資料庫一樣,MyCAT也提供了“資料庫”的定義,並有使用者授權的功能,下面是MyCAT邏輯庫相關的一些概念: schema:邏輯庫,與MySQL中的Database(資料庫)對應,一個邏輯庫中定義了所包括的Table。 table:表,即物理資料庫中儲存的某一張表,與傳統資料庫不同,這裡的表格需要聲明其所儲存的邏輯資料節點DataNode,這是通過表格的分區規則定義來實現的,table可以定義其所屬的“子表(childTable)”,子表的分區依賴於與“父表”的具體分區地址,簡單的說,就是屬於父表裡某一條記錄A的子表的所有記錄都與A儲存在同一個分區上。 分區規則:是一個欄位與函數的捆綁定義,根據這個欄位的取值來返回所在儲存的分區(DataNode)的序號,每個表格可以定義一個分區規則,分區規則可以靈活擴充,預設提供了基於數位分區規則,字串的分區規則等。 dataNode: MyCAT的邏輯資料節點,是存放table的具體物理節點,也稱之為分區節點,通過DataSource來關聯到後端某個具體資料庫上,一般來說,為了高可用性,每個DataNode都設定兩個DataSource,一主一從,當主節點宕機,系統自動切換到從節點。 dataHost:定義某個物理庫的訪問地址,用於捆綁到dataNode上。
MyCAT目前通過設定檔的方式來定義邏輯庫和相關配置:
· MYCAT_HOME/conf/schema.xml中定義邏輯庫,表、分區節點等內容;
· MYCAT_HOME/conf/rule.xml中定義分區規則;
· MYCAT_HOME/conf/server.xml中定義使用者以及系統相關變數,如連接埠等。
下圖給出了MyCAT一個可能的邏輯庫到物理庫(MySQL的完整映射關係),可以看出強大的分區能力以及靈活的Mysql叢集整合能力。
2、 MyCat基本使用教程 2.1 下載和安裝
MyCAT使用Java開發,因為用到了JDK 7的部分功能,所以在使用前請確保安裝了JDK 7.0,要求是JDK 7.0以上,並設定了正確的Java環境變數
目前下載的版本是免安裝,解壓在任意磁碟、根目錄下,避免路徑中出現中文。
目錄下的“Mycat-server-1.2-GA-win.tar.gz”檔案,解壓後的目錄結構如下圖所示:
目錄說明見下表所示:
目錄名稱 |
說明 |
bin |
存放window版本和linux版本,除了提供封裝成服務的版本之外,也提供nowrap的shell指令碼命令,方便大家選擇和修改。 Windows 下 運行:mycat.bat console在控制台啟動程式,也可以裝載成服務,若此程式運行有問題,也可以運行startup_nowrap.bat,確保java命令可以在命令執行。 Warp方式的命令,可以安裝成服務並啟動或停止。 l mycat install (可選) l mycat start 注意,wrap方式的程式,其JVM配置參數在conf/wrap.conf中,可以修改為合適的參數,參數調整參照http://wrapper.tanukisoftware.com/doc/english/properties.html。 |
conf |
存放設定檔: l server.xml:是Mycat伺服器參數調整和使用者授權的設定檔。 l schema.xml:是邏輯庫定義和表以及分區定義的設定檔。 l rule.xml:是分區規則的設定檔,分區規則的具體一些參數資訊單獨存放為檔案,也在這個目錄下,設定檔修改,需要重啟MyCAT或者通過9066連接埠reload。 l wrapper.conf:JVM配置參數等設定。 l log4j.xml:日誌存放在logs/mycat.log中,每天一個檔案,日誌的配置是在conf/log4j.xml中,根據自己的需要,可以調整輸出層級為debug,debug層級下,會輸出更多的資訊,方便排查問題。 |
lib |
MyCAT自身的jar包或依賴的jar包的存放目錄。 |
logs |
MyCAT日誌的存放目錄。日誌存放在logs/mycat.log中,每天一個檔案 |
2.2 啟動和停止
安裝mycat服務 :mycate install
啟動mycat服務 :mycate start
停止mycat服務 :mycate stop
注意:當修改設定檔後,需要重啟mycat服務
3、使用教程 3.1 硬體設定和安裝資料庫
本地 mycat 192.168.1.5
伺服器A mysql 192.168.1.201
伺服器A mysql 192.168.1.202
安裝MySQL伺服器和MySQL用戶端,筆者使用的MySQL伺服器是免安裝版本:mysql-noinstall-5.1.73-winx64,MySQL用戶端是:Navicat for MySQL,免安裝版本安裝方法請參考:http://blog.csdn.net/q98842674/article/details/12094777
3.2 建立資料庫
分別在伺服器A、伺服器B建立所用的分區資料庫;
CREATE database db1; 3.3 設定檔
schema.xml設定檔,因為分庫在不同的伺服器,因此配置兩個datahost;如果在一個datahost中配置多個writeHost,則為主從配置。type="global"時,為全域表,
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
<mycat:schema xmlns:mycat="http://org.opencloudb/">
<schema name="TESTDB" checkSQLschema="false" sqlMaxLimit="100">
<!-- auto sharding by id (long) -->
<table name="travelrecord" dataNode="dn1,dn2" rule="auto-sharding-long" />
<!-- global table is auto cloned to all defined data nodes ,so can join
with any table whose sharding node is in the same data node -->
<table name="company" primaryKey="ID" type="global" dataNode="dn1,dn2" />
<table name="goods" primaryKey="ID" type="global" dataNode="dn1,dn2" />
<!-- random sharding using mod sharind rule -->
<table name="hotnews" primaryKey="ID" dataNode="dn1,dn2"
rule="mod-long" />
<!-- <table name="dual" primaryKey="ID" dataNode="dnx,dnoracle2" type="global"
needAddLimit="false"/> <table name="worker" primaryKey="ID" dataNode="jdbc_dn1,jdbc_dn2,jdbc_dn3"
rule="mod-long" /> -->
<table name="employee" primaryKey="ID" dataNode="dn1,dn2"
rule="sharding-by-intfile" />
<table name="customer" primaryKey="ID" dataNode="dn1,dn2"
rule="sharding-by-intfile">
<childTable name="orders" primaryKey="ID" joinKey="customer_id"
parentKey="id">
<childTable name="order_items" joinKey="order_id"
parentKey="id" />
</childTable>
<childTable name="customer_addr" primaryKey="ID" joinKey="customer_id"
parentKey="id" />
</table>
</schema>
<dataNode name="dn1" dataHost="localhost1" database="db1" />
<dataNode name="dn2" dataHost="localhost2" database="db1" />
<dataHost name="localhost1" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="hostM1" url="192.168.1.201:3306" user="shopuser"
password="123456">
</writeHost>
</dataHost>
<dataHost name="localhost2" maxCon="1000" minCon="10" balance="0"
writeType="0" dbType="mysql" dbDriver="native" switchType="1" slaveThreshold="100">
<heartbeat>select user()</heartbeat>
<writeHost host="hostM1" url="192.168.1.202:3306" user="shopuser"
password="123456">
</writeHost>
</dataHost>
</mycat:schema>
server.xml設定檔,本執行個體很簡單,就只定義user,
name:使用者名稱
password:密碼
schemas:執行個體名,和schema.xml定義的schema對應,這裡的執行個體名是虛擬名,也就是對mycat服務的一種別名,是 應用程式以及用戶端串連的入口。
<?xml version="1.0" encoding="UTF-8"?>
<!-- - - Licensed under the Apache License, Version 2.0 (the "License");
- you may not use this file except in compliance with the License. - You
may obtain a copy of the License at - - http://www.apache.org/licenses/LICENSE-2.0
- - Unless required by applicable law or agreed to in writing, software -
distributed under the License is distributed on an "AS IS" BASIS, - WITHOUT
WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. - See the
License for the specific language governing permissions and - limitations
under the License. -->
<!DOCTYPE mycat:server SYSTEM "server.dtd">
<mycat:server xmlns:mycat="http://org.opencloudb/">
<system>
<property name="defaultSqlParser">druidparser</property>
<!-- <property name="useCompression">1</property>--> <!--1為開啟mysql壓縮協議-->
<!-- <property name="processorBufferChunk">40960</property> -->
<!--
<property name="processors">1</property>
<property name="processorExecutor">32</property>
-->
<!--預設是65535 64K 用於sql解析時最大文本長度 -->
<!--<property name="maxStringLiteralLength">65535</property>-->
<!--<property name="sequnceHandlerType">0</property>-->
<!--<property name="backSocketNoDelay">1</property>-->
<!--<property name="frontSocketNoDelay">1</property>-->
<!--<property name="processorExecutor">16</property>-->
<!--
<property name="mutiNodeLimitType">1</property> 0:開啟小數量級(預設) ;1:開啟億級資料排序
<property name="mutiNodePatchSize">100</property> 億級數量排序批量
<property name="processors">32</property> <property name="processorExecutor">32</property>
<property name="serverPort">8066</property> <property name="managerPort">9066</property>
<property name="idleTimeout">300000</property> <property name="bindIp">0.0.0.0</property>
<property name="frontWriteQueueSize">4096</property> <property name="processors">32</property> -->
</system>
<user name="test">
<property name="password">test</property>
<property name="schemas">TESTDB</property>
</user>
</mycat:server>
3.4 登入mycat
在任意有mysql的用戶端的機器串連Mycat, 執行以下命令
mysql -utest -ptest -h192.168.1.5 -P8066 -DTESTDB 注意:8066登入mycat資料連接埠,9066登入mycat管理連接埠(能看到mycat內的配置、以及各個資料庫連接情況,很有用)
3.5 測試
全域表:company
mysql> create table company(id int not null primary key,name varchar(100),sharding_id int not null);
Query OK, 0 rows affected (0.30 sec)
mysql> explain create table company(id int not null primary key,name varchar(100),sharding_id int not null);
+-----------+------------------------------------------------------------------------------------------------+
| DATA_NODE | SQL |
+-----------+------------------------------------------------------------------------------------------------+
| dn1 | create table company(id int not null primary key,name varchar(100),sharding_id int not null) |
| dn2 | create table company(id int not null primary key,name varchar(100),sharding_id int not null) |
+-----------+------------------------------------------------------------------------------------------------+
2 rows in set (0.04 sec)
mysql> insert into company(id,name,sharding_id) values(1,'leader us',10000);
ERROR 2006 (HY000): MySQL server has gone away
No connection. Trying to reconnect...
Connection id: 6
Current database: TESTDB
Query OK, 1 row affected (0.03 sec)
mysql> explain inser