批次更新
mysql更新語句很簡單,更新一條資料的某個欄位,一般這樣寫:
代碼如下 |
複製代碼 |
UPDATE mytable SET myfield = 'value' WHERE other_field = 'other_value'; |
如果更新同一欄位為同一個值,mysql也很簡單,修改下where即可:
代碼如下 |
複製代碼 |
UPDATE mytable SET myfield = 'value' WHERE other_field in ('other_values');
|
這裡注意 ‘other_values’ 是一個逗號(,)分隔的字串,如:1,2,3
那如果更新多條資料為不同的值,可能很多人會這樣寫:
代碼如下 |
複製代碼 |
foreach ($display_order as $id => $ordinal) { $sql = "UPDATE categories SET display_order = $ordinal WHERE id = $id"; mysql_query($sql); } |
即是迴圈一條一條的更新記錄。一條記錄update一次,這樣效能很差,也很容易造成阻塞。
那麼能不能一條sql語句實現批次更新呢?mysql並沒有提供直接的方法來實現批次更新,但是可以用點小技巧來實現。
代碼如下 |
複製代碼 |
UPDATE mytable SET myfield = CASE id WHEN 1 THEN 'value' WHEN 2 THEN 'value' WHEN 3 THEN 'value' END WHERE id IN (1,2,3) |
這裡使用了case when 這個小技巧來實現批次更新。
舉個例子:
代碼如下 |
複製代碼 |
UPDATE categories SET display_order = CASE id WHEN 1 THEN 3 WHEN 2 THEN 4 WHEN 3 THEN 5 END WHERE id IN (1,2,3) |
這句sql的意思是,更新display_order 欄位,如果id=1 則display_order 的值為3,如果id=2 則 display_order 的值為4,如果id=3 則 display_order 的值為5。
即是將條件陳述式寫在了一起。
這裡的where部分不影響代碼的執行,但是會提高sql執行的效率。確保sql語句僅執行需要修改的行數,這裡只有3條資料進行更新,而where子句確保只有3行資料執行。
如果更新多個值的話,只需要稍加修改:
代碼如下 |
複製代碼 |
UPDATE categories SET display_order = CASE id WHEN 1 THEN 3 WHEN 2 THEN 4 WHEN 3 THEN 5 END, title = CASE id WHEN 1 THEN 'New Title 1' WHEN 2 THEN 'New Title 2' WHEN 3 THEN 'New Title 3' END WHERE id IN (1,2,3) |
到這裡,已經完成一條mysql語句更新多條記錄了。
但是要在業務中運用,需要結合服務端語言,這裡以php為例,構造這條mysql語句:
代碼如下 |
複製代碼 |
$display_order = array( 1 => 4, 2 => 1, 3 => 2, 4 => 3, 5 => 9, 6 => 5, 7 => 8, 8 => 9 ); $ids = implode(',', array_keys($display_order)); $sql = "UPDATE categories SET display_order = CASE id "; foreach ($display_order as $id => $ordinal) { $sql .= sprintf("WHEN %d THEN %d ", $id, $ordinal); } $sql .= "END WHERE id IN ($ids)"; echo $sql; |
這個例子,有8條記錄進行更新。代碼也很容易理解,你學會了嗎
效能分析
當我使用上萬條記錄利用mysql批次更新,發現使用最原始的批量update發現效能很差,將網上看到的總結一下一共有以下三種辦法:
1.批量update,一條記錄update一次,效能很差
代碼如下 |
複製代碼 |
update test_tbl set dr='2' where id=1; |
2.replace into 或者insert into ...on duplicate key update
代碼如下 |
複製代碼 |
replace into test_tbl (id,dr) values (1,'2'),(2,'3'),...(x,'y'); |
或者使用
代碼如下 |
複製代碼 |
insert into test_tbl (id,dr) values (1,'2'),(2,'3'),...(x,'y') on duplicate key update dr=values(dr); |
3.建立暫存資料表,先更新暫存資料表,然後從暫存資料表中update
代碼如下 |
複製代碼 |
create temporary table tmp(id int(4) primary key,dr varchar(50)); insert into tmp values (0,'gone'), (1,'xx'),...(m,'yy'); update test_tbl, tmp set test_tbl.dr=tmp.dr where test_tbl.id=tmp.id; |
注意:這種方法需要使用者有temporary 表的create 許可權。
下面是上述方法update 100000條資料的效能測試結果:
逐條update
real 0m15.557s
user 0m1.684s
sys 0m1.372s
replace into
real 0m1.394s
user 0m0.060s
sys 0m0.012s
insert into on duplicate key update
real 0m1.474s
user 0m0.052s
sys 0m0.008s
create temporary table and update:
real 0m0.643s
user 0m0.064s
sys 0m0.004s
就測試結果來看,測試當時使用replace into效能較好。
replace into 和insert into on duplicate key update的不同在於:
replace into 操作本質是對重複的記錄先delete 後insert,如果更新的欄位不全會將缺失的欄位置為預設值
insert into 則是只update重複記錄,不會改變其它欄位。