大多數網站的內容都存在資料庫裡,使用者通過請求來訪問內容。資料庫非常的快,有許多技巧能讓你最佳化資料庫的速度,使你不浪費伺服器的資源。在這篇文章中,我收錄了十個最佳化資料庫速度的技巧。
0. 小心設計資料庫
第一個技巧也許看來理所當然,但事實上大部分資料庫的問題都來自於設計不好的資料庫結構。
譬如我曾經遇見過將用戶端資訊和支付資訊儲存在同一個資料庫列中的例子。對於系統和用資料庫的開發人員來說,這很糟糕。
建立資料庫時,應當將資訊儲存在不同的表裡,採用標準的命名方式,並採用主鍵。
來源: http://www.simple-talk.com/sql/database-administration/ten-common-database-design-mistakes/
1. 清楚你需要最佳化的地方
如果你想最佳化某個查詢語句,清楚的知道這個語句的結果是非常有協助的。採用EXPLAIN語句,你將獲得很多有用的資訊,下面來看個例子:
- EXPLAIN SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column;
來源: http://dev.mysql.com/doc/refman/5.0/en/using-explain.html
2. 最快的查詢語句…是那些你沒發送的語句
每次你向資料庫發送一條語句,你都會用掉很多伺服器資源。所以在很高流量的網站中,最好的方法是將你的查詢語句緩衝起來。
有許多種緩衝語句的方法,下面列出了幾個:
AdoDB: AdoDB是一個PHP的資料庫簡化庫。使用它,你可以選用不同的資料庫系統(MySQL, PostGreSQL, Interbase等等),而且它就是為了速度而設計的。AdoDB提供了簡單但強大的緩衝系統。還有,AdoDB擁有BSD許可,你可以在你的項目中免費使用它。對於商業化的項目,它也有LGPL許可。
Memcached:Memcached是一種分布式記憶體緩衝系統,它可以減輕資料庫的負載,來加速基於動態資料庫的網站。
CSQL Cache: CSQL緩衝是一個開源的資料緩衝架構。我沒有試過它,但它看起來非常的棒。
3. 不要select你不需要的
擷取想要的資料,一種非常常見的方式就是採用*字元,這會列出所有的列。
- SELECT * FROM wp_posts;
然而,你應該僅列出你需要的列,如下所示。如果在一個非常小型的網站,譬如,一分鐘一個使用者訪問,可能沒有什麼分別。然而如果像Cats Who Code這樣大流量的網站,這就為資料庫省了很多事。
- SELECT title, excerpt, author FROM wp_posts;
4. 採用LIMIT
僅獲得某個特定行數的資料是非常常見的。譬如部落格每頁只顯示十篇文章。這時,你應該使用LIMIT,來限定你想選定的資料的行數。
如果沒有LIMIT,表有100,000行資料,你將會遍曆所有的行數,這對於伺服器來說是不必要的負擔。
- SELECT title, excerpt, author FROM wp_posts LIMIT 10;
5. 避免迴圈中的查詢
當在PHP中使用SQL時,可以將SQL放在迴圈語句中。但這麼做給你的資料庫增加了負擔。
下面的例子說明了“在迴圈語句中巢狀查詢語句”的問題:
- foreach ($display_order as $id => $ordinal) {
- $sql = "UPDATE categories SET display_order = $ordinal WHERE id = $id";
- mysql_query($sql);
- }
你可以這麼做:
- UPDATE categories
- SET display_order = CASE id
- WHEN 1 THEN 3
- WHEN 2 THEN 4
- WHEN 3 THEN 5
- END
- WHERE id IN (1,2,3)
來源: http://www.karlrixon.co.uk/articles/sql/update-multiple-rows-with-different-values-and-a-single-sql-query/
6. 採用join來替換子查詢
As a programmer, subqueries are something that you can be tempted to use and abuse. Subqueries, as show below, can be very useful:
程式員可能會喜歡用子查詢,甚至濫用。下面的子查詢非常有用:
- SELECT a.id,
- (SELECT MAX(created)
- FROM posts
- WHERE author_id = a.id)
- AS latest_post FROM authors a
雖然子查詢很有用,但join語句可以替換它,join語句執行起來更快。
- SELECT a.id, MAX(p.created) AS latest_post
- FROM authors a
- INNER JOIN posts p
- ON (a.id = p.author_id)
- GROUP BY a.id
來源: http://20bits.com/articles/10-tips-for-optimizing-mysql-queries-that-dont-suck/
7. 小心使用萬用字元
萬用字元非常好用,在搜尋資料的時候可以用萬用字元來代替一個或多個字元。我不是說不能用,而是,應該小心使用,並且不要使用全詞萬用字元(full wildcard),首碼萬用字元或後置萬用字元可以完成相同的任務。
事實上,在百萬數量級的資料上採用全詞萬用字元來搜尋會讓你的資料庫當機。
- #Full wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE '%hello%';
- #Postfix wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE 'hello%';
- #Prefix wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE '%hello';
來源: http://hungred.com/useful-information/ways-optimize-sql-queries/
8. 採用UNION來代替OR
下面的例子採用OR語句來:
- SELECT * FROM a, b WHERE a.p = b.q or a.x = b.y;
UNION語句,你可以將2個或更多select語句的結果拼在一起。下面的例子返回的結果同上面的一樣,但是速度要快些:
- SELECT * FROM a, b WHERE a.p = b.q
- UNION
- SELECT * FROM a, b WHERE a.x = b.y
來源: http://www.bcarter.com/optimsql.htm
9. 使用索引
資料庫索引和你在圖書館中見到的索引類似:能讓你更快速的擷取想要的資訊,正書館中的索引能讓讀者更快的找到想要的書一樣。
可以在一個列上建立索引,也可以在多個列上建立。索引是一種資料結構,它將表中的一列或多列的值以特定的順序組織起來。
下面的語句在Product表的Model列上建立索引。這個索引的名字叫作idxModel
- CREATE INDEX idxModel ON Product (Model);
來源: http://www.sql-tutorial.com/sql-indexes-sql-tutorial/
英文:catswhocode.com