摘要: 利用binlog閃回誤操作資料。
基本上每個跟資料庫打交道的程式員(當然也可能是你同事)都會碰一個問題,MySQL誤操作後如何快速復原?比如,delete一張表,忘加限制條件,整張表沒了。假如這還是線上環境核心業務資料,那這事就鬧大了。誤操作後,能快速復原資料是非常重要的。
傳統解法
用全量備份重搭執行個體,再利用增量binlog備份,恢複到誤操作之前的狀態。然後跳過誤操作的SQL,再繼續應用binlog。此法費時費力,不值得再推薦。
利用binlog2sql快速閃回
首先,確認你的MySQL server開啟了binlog,設定了以下參數:
[mysqld]
server-id = 1
log_bin = /var/log/mysql/mysql-bin.log
max_binlog_size = 100M
binlog-format = row
|
如果沒有開啟binlog,也沒有預先產生復原SQL,那真的無法快速復原了。對存放重要業務資料的MySQL,強烈建議開啟binlog。
隨後,安裝開源工具ps://github.com/danfengcao/binlog2sql">binlog2sql。binlog2sql是一款簡單易用的binlog解析工具,其中一個功能就是產生復原SQL。
shell> git clone https://github.com/danfengcao/binlog2sql.git
shell> pip install -r requirements.txt
|
然後,我們就可以產生復原SQL了。
背景:小明在20點多時誤刪了test庫tbl表整張表的資料,需要緊急復原。
test庫tbl表原有資料
mysql>select*fromtbl;
+----+--------+---------------------+
| id |name | addtime |
+----+--------+---------------------+
| 1 | 小趙 | 2016-12-10 00:04:33 |
| 2 | 小錢 | 2016-12-10 00:04:48 |
| 3 | 小孫 | 2016-12-13 20:25:00 |
| 4 | 小李 | 2016-12-12 00:00:00 |
+----+--------+---------------------+
4rowsinset(0.00 sec)
mysql>deletefromtbl;
Query OK, 4rowsaffected (0.00 sec)
20:28時,tbl表誤操作被清空
mysql>select*fromtbl;
Emptyset(0.00 sec)
|
恢複資料步驟:
1、登入mysql,查看目前的binlog檔案
|
1
2
3
4
5
6
7
|
mysql> show master status;
+------------------+-----------+
| Log_name | File_size |
+------------------+-----------+
| mysql-bin.000051 | 967 |
| mysql-bin.000052 | 965 |
+------------------+-----------+
|
2、最新的binlog檔案是mysql-bin.000052,我們再定位誤操作SQL的binlog位置。誤操作人只能知道大致的誤操作時間,我們根據大致時間過濾資料。
shell> python binlog2sql/binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin'-dtest -ttbl--start-file='mysql-bin.000052' --start-datetime='2016-12-13 20:25:00' --stop-datetime='2016-12-13 20:30:00'
輸出:
INSERTINTO`test`.`tbl`(`addtime`, `id`, `name`)VALUES('2016-12-13 20:25:00', 3,'小孫'); #start 4end290time2016-12-13 20:25:46
INSERTINTO`test`.`tbl`(`addtime`, `id`, `name`)VALUES('2016-12-13 20:26:00', 4,'小李'); #start 317end487time2016-12-13 20:26:26
UPDATE`test`.`tbl`SET`addtime`='2016-12-12 00:00:00', `id`=4, `name`='小李'WHERE`addtime`='2016-12-13 20:26:00'AND`id`=4AND`name`='小李'LIMIT 1; #start 514end701time2016-12-13 20:27:07
DELETEFROM`test`.`tbl`WHERE`addtime`='2016-12-10 00:04:33'AND`id`=1AND`name`='小趙'LIMIT 1; #start 728end938time2016-12-13 20:28:05
DELETEFROM`test`.`tbl`WHERE`addtime`='2016-12-10 00:04:48'AND`id`=2AND`name`='小錢'LIMIT 1; #start 728end938time2016-12-13 20:28:05
DELETEFROM`test`.`tbl`WHERE`addtime`='2016-12-13 20:25:00'AND`id`=3AND`name`='小孫'LIMIT 1; #start 728end938time2016-12-13 20:28:05
DELETEFROM`test`.`tbl`WHERE`addtime`='2016-12-12 00:00:00'AND`id`=4AND`name`='小李'LIMIT 1; #start 728end938time2016-12-13 20:28:05
|
3、我們得到了誤操作sql的準確位置在728-938之間,再根據位置進一步過濾,使用flashback模式產生復原sql,檢查復原sql是否正確
shell> python binlog2sql/binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin'-dtest -ttbl--start-file='mysql-bin.000052' --start-pos=3346 --end-pos=3556 -B
輸出:
INSERTINTO`test`.`tbl`(`addtime`, `id`, `name`)VALUES('2016-12-12 00:00:00', 4,'小李'); #start 728end938time2016-12-13 20:28:05
INSERTINTO`test`.`tbl`(`addtime`, `id`, `name`)VALUES('2016-12-13 20:25:00', 3,'小孫'); #start 728end938time2016-12-13 20:28:05
INSERTINTO`test`.`tbl`(`addtime`, `id`, `name`)VALUES('2016-12-10 00:04:48', 2,'小錢'); #start 728end938time2016-12-13 20:28:05
INSERTINTO`test`.`tbl`(`addtime`, `id`, `name`)VALUES('2016-12-10 00:04:33', 1,'小趙'); #start 728end938time2016-12-13 20:28:05
|
確認復原sql正確,執行復原語句。登入mysql確認,資料復原成功。
shell> python binlog2sql.py -h127.0.0.1 -P3306 -uadmin -p'admin'-dtest -ttbl--start-file='mysql-bin.000052' --start-pos=3346 --end-pos=3556 -B | mysql -h127.0.0.1 -P3306 -uadmin -p'admin'
mysql>select*fromtbl;
+----+--------+---------------------+
| id |name | addtime |
+----+--------+---------------------+
| 1 | 小趙 | 2016-12-10 00:04:33 |
| 2 | 小錢 | 2016-12-10 00:04:48 |
| 3 | 小孫 | 2016-12-13 20:25:00 |
| 4 | 小李 | 2016-12-12 00:00:00 |
+----+--------+---------------------+
|
至此,不用再擔心被炒魷魚了。
常見問題
有人會問,我DDL誤操作了怎麼快速復原?比如drop了一張大表。
很難做到。因為即使在在row模式下,DDL操作也不會把每行資料的變化記錄到binlog,所以DDL無法通過binlog復原。實現DDL復原,必須要在執行DDL前先備份老資料。確實有人通過修改mysql server源碼實現了DDL的快速復原,我找到阿里的xiaobin lin提交了一個patch。但據我所知,國內很少有互連網公司應用了這個特性。原因的話,我認為最主要還是懶的去折騰,沒必要搞這個低頻功能,次要原因是會增加一些額外儲存。
所以,DDL誤操作的話一般只能通過備份來恢複。如果公司連備份也不能用了,那真的建議去買張飛機票了。幹啥?跑唄
mysql除了binlog2sql,是否還有其他復原工具?
當然有。阿里彭立勳對mysqlbinlog增加了flashback的特性,這應該是mysql最早有的flashback功能,彭解決的是DML的復原,並說明了利用binlog進行DML閃回的設計思路。DDL復原特性也是由阿里團隊提出並實現的。這兩個功能是有創新精神的,此後出現的閃回工具基本都是對上面兩者的模仿。另外,去哪兒開源的Inception是一套MySQL自動化營運工具,這個就比較重了,支援DML復原,還不是從binlog復原的,是從備份復原的,也支援DDL復原表結構,資料是復原不了滴~ 還有一種做法叫slave延時備份,搞台不加業務流量的slave,故意延遲一段時間,這其實是在傳統辦法的基礎上去除了執行個體恢複這步。此法會額外消耗一台機器,我們不推薦這麼做。