WEB開發人員不光要解決程式的效率問題,對資料庫的快速存取和相應也是一個大問題。希望本文能對大家掌握MySQL最佳化技巧有所協助。
1. 最佳化你的MySQL查詢快取
在MySQL伺服器上進行查詢,可以啟用高速查詢快取。讓資料庫引擎在後台悄悄的處理是提高效能的最有效方法之一。當同一個查詢被執行多次時,如果結果是從緩衝中提取,那是相當快的。
但主要的問題是,它是那麼容易被隱藏起來以至於我們大多數程式員會忽略它。在有些處理任務中,我們實際上是可以阻止查詢快取工作的。
1. // query cache does NOT work
2. $r = mysql_query("SELECT username FROM user WHERE signup_date >= CURDATE()");
3.
4. // query cache works!
5. $today = date("Y-m-d");
6. $r = mysql_query("SELECT username FROM user WHERE signup_date >= '$today'");
7.
8. // query cache does NOT work
9. $r = mysql_query("SELECT username FROM user WHERE signup_date >= CURDATE()");
10.
11. // query cache works!
12. $today = date("Y-m-d");
13. $r = mysql_query("SELECT username FROM user WHERE signup_date >= '$today'");
2. 用EXPLAIN使你的SELECT查詢更加清晰
使用EXPLAIN關鍵字是另一個MySQL最佳化技巧,可以讓你瞭解MySQL進行中什麼樣的查詢操作,這可以協助你發現瓶頸的所在,並顯示出查詢或表結構在哪裡出了問題。
EXPLAIN查詢的結果,可以告訴你那些索引正在被引用,表是如何被掃描和排序的等等。
實現一個SELECT查詢(最好是比較複雜的一個,帶joins方式的),在裡面添加上你的關鍵詞解釋,在這裡我們可以使用phpMyAdmin,他會告訴你表中的結果。舉例來說,假如當我在執行joins時,正忘記往一個索引中添加列,EXPLAIN能協助我找到問題的所在。
添加索引到group_id field後
3. 利用LIMIT 1取得唯一行
有時,當你要查詢一張表是,你知道自己只需要看一行。你可能會去的一條十分獨特的記錄,或者只是剛好檢查了任何存在的記錄數,他們都滿足了你的WHERE子句。
在這種情況下,增加一個LIMIT 1會令你的查詢更加有效。這樣資料庫引擎發現只有1後將停止掃描,而不是去掃描整個表或索引。
1. // do I have any users from Alabama?
2. // what NOT to do:
3. $r = mysql_query("SELECT * FROM user WHERE state = 'Alabama'");
4. if (mysql_num_rows($r) > 0) {
5. // ...
6. }
7. // much better:
8. $r = mysql_query("SELECT 1 FROM user WHERE state = 'Alabama' LIMIT 1");
9. if (mysql_num_rows($r) > 0) {
10. // ...
11. }
4. 索引中的檢索欄位
索引不僅是主鍵或唯一鍵。如果你想搜尋表中的任何列,你應該一直指向索引。
5. 保證串連的索引是相同的類型
如果應用程式中包含多個串連查詢,你需要確保你連結的列在兩邊的表上都被索引。這會影響MySQL如何最佳化內部聯結操作。
此外,加入的列,必須是同一類型。例如,你加入一個DECIMAL列,而同時加入另一個表中的int列,MySQL將無法使用其中至少一個指標。即使字元編碼必須同為字串類型。
1. // looking for companies in my state
2. $r = mysql_query("SELECT company_name FROM users
3. LEFT JOIN companies ON (users.state = companies.state)
4. WHERE users.id = $user_id");
5.
6. // both state columns should be indexed
7. // and they both should be the same type and character encoding
8. // or MySQL might do full table scans
6. 不要使用BY RAND()命令
這是一個令很多新手程式員會掉進去的陷阱。你可能不知不覺中製造了一個可怕的平靜。這個陷阱在你是用BY RAND()命令時就開始建立了。
如果您真的需要隨機顯示你的結果,有很多更好的途徑去實現。誠然這需要寫更多的代碼,但是能避免效能瓶頸的出現。問題在於,MySQL可能會為表中每一個獨立的行執行BY RAND()命令(這會消耗處理器的處理能力),然後給你僅僅返回一行。
1. // what NOT to do:
2. $r = mysql_query("SELECT username FROM user ORDER BY RAND() LIMIT 1");
3. // much better:
4. $r = mysql_query("SELECT count(*) FROM user");
5. $d = mysql_fetch_row($r);
6. $rand = mt_rand(0,$d[0] - 1);
7.
8. $r = mysql_query("SELECT username FROM user LIMIT $rand, 1");
7. 盡量避免SELECT *命令
從表中讀取越多的資料,查詢會變得更慢。他增加了磁碟需要操作的時間,還是在資料庫伺服器與WEB伺服器是獨立分開的情況下。你將會經曆非常漫長的網路延遲,僅僅是因為資料不必要的在伺服器之間傳輸。
始終指定你需要的列,這是一個非常良好的習慣。
1. // not preferred
2. $r = mysql_query("SELECT * FROM user WHERE user_id = 1");
3. $d = mysql_fetch_assoc($r);
4. echo "Welcome {$d['username']}";
5. // better:
6. $r = mysql_query("SELECT username FROM user WHERE user_id = 1");
7. $d = mysql_fetch_assoc($r);
8. echo "Welcome {$d['username']}";
9. // the differences are more significant with bigger result sets
8. 從PROCEDURE ANALYSE()中獲得建議
PROCEDURE ANALYSE()可讓MySQL的柱結構分析和表中的實際資料來給你一些建議。如果你的表中已經存在實際資料了,能為你的重大決策服務。
9. 準備好的語句
準備好的語句,可以從效能最佳化和安全兩方面對大家有所協助。
準備好的語句在過濾已經綁定的變數預設情況下,能給應用程式以有效保護,防止SQL注入攻擊。當然你也可以手動過濾,不過由於大多數程式員健忘的性格,很難達到效果。
1. // create a prepared statement
2. if ($stmt = $mysqli->prepare("SELECT username FROM user WHERE state=?")) {
3. // bind parameters
4. $stmt->bind_param("s", $state);
5. // execute
6. $stmt->execute();
7. // bind result variables
8. $stmt->bind_result($username);
9. // fetch value
10. $stmt->fetch();
11. printf("%s is from %sn", $username, $state);
12. $stmt->close();
13. }
10. 將IP地址儲存為無符號整型
許多程式員在建立一個VARCHAR(15)時並沒有意識到他們可以將IP地址以整數形式來儲存。當你有一個INT類型時,你只佔用4個位元組的空間,這是一個固定大小的領域。
你必須確定你所操作的列是一個UNSIGNED INT類型的,因為IP地址將使用32位unsigned integer。
1. $r = "UPDATE users SET ip = INET_ATON('{$_SERVER['REMOTE_ADDR']}') WHERE user_id = $user_id";
十大MySQL最佳化技巧就介紹到這裡。