標籤:
mysql最佳化是一個相對來說比較重要的事情了,特別像對mysql讀寫比較多的網站就顯得非常重要了,下面我們來介紹mysql大記憶體高效能最佳化方案
8G記憶體下MySQL的最佳化
按照下面的設定試試看:
key_buffer = 3840M
max_allowed_packet = 16M
table_cache = 1024
sort_buffer_size = 32M
read_buffer_size = 32M
read_rnd_buffer_size = 32M
myisam_sort_buffer_size = 256M
thread_cache_size = 32
query_cache_size = 256M
# Try number of CPU‘s*2 for thread_concurrency
thread_concurrency = 8
其中key_buffer_size 上限是4G,不能再多了
但是實際的為了使MySql的效能最佳化,記憶體的分配是需要進行調試的
mysql大記憶體高效能最佳化
伺服器硬體對MySQL效能的影響
1、磁碟尋道能力(磁碟I/O),以目前高轉速SCSI硬碟(7200轉/秒)為例,這種硬碟理論上每秒尋道7200次,這是物理特性決定的,沒有辦法改變。 MySQL每秒鐘都在進行大量、複雜的查詢操作,對磁碟的讀寫量可想而知。所以,通常認為磁碟I/O是制約MySQL效能的最大因素之一,對於日均訪問量 在100萬PV以上的Discuz!論壇,由於磁碟I/O的制約,MySQL的效能會非常低下!解決這一制約因素可以考慮以下幾種解決方案: 使用RAID-0+1磁碟陣列,注意不要嘗試使用RAID-5,MySQL在RAID-5磁碟陣列上的效率不會像你期待的那樣快。
2、CPU 對於MySQL應用,推薦使用S.M.P.架構的多路對稱CPU,例如:可以使用兩顆Intel Xeon 3.6GHz的CPU,現在我較推薦用4U的伺服器來專門做資料庫伺服器,不僅僅是針對於mysql。
3、實體記憶體對於一台使用MySQL的Database Server來說,伺服器記憶體建議不要小於2GB,推薦使用4GB以上的實體記憶體,不過記憶體對於現在的伺服器而言可以說是一個可以忽略的問題,工作中遇到了高端伺服器基本上記憶體都超過了32G。
MySQL自身因素
當解決了上述伺服器硬體制約因素後,讓我們看看MySQL自身的最佳化是如何操作的。對MySQL自身的最佳化主要是對其設定檔 my.cnf中的各項參數進行最佳化調整。下面我們介紹一些對效能影響較大的參數。由於my.cnf檔案的最佳化設定是與伺服器硬體設定息息相關的,因而我們指定一個假想的伺服器硬體環境:
CPU:2顆Intel Xeon 2.4GHz
記憶體:4GB DDR
硬碟:SCSI 73GB(很常見的2U伺服器)。
下面,我們根據以上硬體設定結合一份已經最佳化好的my.cnf進行說明:
以下只列出my.cnf檔案中[mysqld]段落中的內容,其他段落內容對MySQL運行效能影響甚微,因而姑
且忽略。
[mysqld]
port = 3306
serverid = 1
socket = /tmp/mysql.sock
skip-locking
#避免MySQL的外部鎖定,減少出錯幾率增強穩定性。
skip-name-resolve
#禁止MySQL對外部串連進行DNS解析,使用這一選項可以消除MySQL進行DNS解析的時間。但需要注意,如果開啟該選項,則所有遠程主機串連授權都要使用IP地址方式,否則MySQL將無法正常處理串連請求!
back_log = 384
#back_log 參數的值指出在MySQL暫時停止回應新請求之前的短時間內多少個請求可以被存在堆棧中。如果系統在一個短時間內有很多串連,則需要增大該參數的值,該參數值指定到來的TCP/IP串連的偵聽隊列的大小。不同的作業系統在這個隊列大小上有它自 己的限制。 試圖設定back_log高於你的作業系統的限制將是無效的。預設值為50。對於Linux系統推薦設定為小於512的整數。
key_buffer_size = 256M
#key_buffer_size指定用於索引的緩衝區大小,增加它可得到更好的索引處理效能。對於記憶體在4GB左右的伺服器該參數可設定為256M或384M。注意:該參數值設定的過大反而會是伺服器整體效率降低!
max_allowed_packet = 4M
thread_stack = 256K
table_cache = 128K
sort_buffer_size = 6M
#查詢排序時所能使用的緩衝區大小。注意:該參數對應的分配記憶體是每串連獨佔,如果有100個串連,那麼實際分配的總共排序緩衝區大小為100 × 6 = 600MB。所以,對於記憶體在4GB左右的伺服器推薦設定為6-8M。
read_buffer_size = 4M
#讀查詢操作所能使用的緩衝區大小。和sort_buffer_size一樣,該參數對應的分配記憶體也是每串連獨享。
join_buffer_size = 8M
#聯集查詢操作所能使用的緩衝區大小,和sort_buffer_size一樣,該參數對應的分配記憶體也是每串連獨享。
myisam_sort_buffer_size = 64M
table_cache = 512
thread_cache_size = 64
query_cache_size = 64M
# 指定MySQL查詢緩衝區的大小。可以通過在MySQL控制台觀察,如果Qcache_lowmem_prunes的值非常大,則表明經常出現緩衝不夠的 情況;如果Qcache_hits的值非常大,則表明查詢緩衝使用非常頻繁,如果該值較小反而會影響效率,那麼可以考慮不用查詢緩 沖;Qcache_free_blocks,如果該值非常大,則表明緩衝區中片段很多。
tmp_table_size = 256M
max_connections = 768
#指定MySQL允許的最大串連進程數。如果在訪問論壇時經常出現Too Many Connections的錯誤提 示,則需要增大該參數值。
max_connect_errors = 10000000
wait_timeout = 10
#指定一個請求的最大連線時間,對於4GB左右記憶體的伺服器可以設定為5-10。
thread_concurrency = 8
#該參數取值為伺服器邏輯CPU數量*2,在本例中,伺服器有2顆物理CPU,而每顆物理CPU又支援H.T超執行緒,所以實際取值為4*2=8
skip-networking
#開啟該選項可以徹底關閉MySQL的TCP/IP串連方式,如果WEB伺服器是以遠端連線的方式訪問MySQL資料庫伺服器則不要開啟該選項!否則將無法正常串連!
table_cache=1024
#實體記憶體越大,設定就越大.預設為2402,調到512-1024最佳
innodb_additional_mem_pool_size=4M
#預設為2M
innodb_flush_log_at_trx_commit=1
#設定為0就是等到innodb_log_buffer_size列隊滿後再統一儲存,預設為1
innodb_log_buffer_size=2M
#預設為1M
innodb_thread_concurrency=8
#你的伺服器CPU有幾個就設定為幾,建議用預設一般為8
key_buffer_size=256M
#預設為218,調到128最佳
tmp_table_size=64M
#預設為16M,調到64-256最掛
read_buffer_size=4M
#預設為64K
read_rnd_buffer_size=16M
#預設為256K
sort_buffer_size=32M
#預設為256K
thread_cache_size=120
#預設為60
query_cache_size=32M
值得注意的是:很多情況需要具體情況具體分析。
如果Key_reads太大,則應該把my.cnf中Key_buffer_size變大,保持Key_reads/Key_read_requests至少1/100以上,越小越好。
提升效能的建議
1.如果opened_tables太大,應該把my.cnf中的table_cache變大
2.如果Key_reads太大,則應該把my.cnf中key_buffer_size變大.可以用Key_reads/Key_read_requests計算出cache失敗率
3.如果Handler_read_rnd太大,則你寫的SQL語句裡很多查詢都是要掃描整個表,而沒有發揮鍵的作用
4.如果Threads_created太大,就要增加my.cnf中thread_cache_size的值.可以用Threads_created/Connections計算cache命中率
5.如果Created_tmp_disk_tables太大,就要增加my.cnf中tmp_table_size的值,用基於記憶體的暫存資料表代替基於磁碟的
除了機器最佳化我們的sql語句也可以最佳化
1. 為查詢快取最佳化你的查詢
大多數的MySQL伺服器都開啟了查詢快取。這是提高性最有效方法之一,而且這是被MySQL的資料庫引擎處理的。當有很多相同的查詢被執行了多次的時候,這些查詢結果會被放到一個緩衝中,這樣,後續的相同的查詢就不用動作表而直接存取緩衝結果了。
這裡最主要的問題是,對於程式員來說,這個事情是很容易被忽略的。因為,我們某些查詢語句會讓MySQL不使用緩衝。請看下面的樣本:
// 查詢快取不開啟
$r = mysql_query("SELECT username FROM user WHERE signup_date >= CURDATE()");
// 開啟查詢快取
$today = date("Y-m-d");
$r = mysql_query("SELECT username FROM user WHERE signup_date >= ‘$today‘");
上面兩條SQL語句的差別就是 CURDATE() ,MySQL的查詢快取對這個函數不起作用。所以,像 NOW() 和 RAND() 或是其它的諸如此類的SQL函數都不會開啟查詢快取,因為這些函數的返回是會不定的易變的。所以,你所需要的就是用一個變數來代替MySQL的函數,從而開啟緩衝。
2. EXPLAIN 你的 SELECT 查詢
使用 EXPLAIN 關鍵字可以讓你知道MySQL是如何處理你的SQL語句的。這可以幫你分析你的查詢語句或是表結構的效能瓶頸。
EXPLAIN 的查詢結果還會告訴你你的索引主鍵被如何利用的,你的資料表是如何被搜尋和排序的……等等,等等。
挑一個你的SELECT語句(推薦挑選那個最複雜的,有多表聯結的),把關鍵字EXPLAIN加到前面。你可以使用phpmyadmin來做這個事。然後,你會看到一張表格。下面的這個樣本中,我們忘記加上了group_id索引,並且有表聯結:
當我們為 group_id 欄位加上索引後:
我們可以看到,前一個結果顯示搜尋了 7883 行,而後一個只是搜尋了兩個表的 9 和 16 行。查看rows列可以讓我們找到潛在的效能問題。
3. 當只要一行資料時使用 LIMIT 1
當你查詢表的有些時候,你已經知道結果只會有一條結果,但因為你可能需要去fetch遊標,或是你也許會去檢查返回的記錄數。
在這種情況下,加上 LIMIT 1 可以增加效能。這樣一樣,MySQL資料庫引擎會在找到一條資料後停止搜尋,而不是繼續往後查少下一條符合記錄的資料。
下面的樣本,只是為了找一下是否有“中國”的使用者,很明顯,後面的會比前面的更有效率。(請注意,第一條中是Select *,第二條是Select 1)
// 沒有效率的:
$r = mysql_query("SELECT * FROM user WHERE country = ‘China‘");
if (mysql_num_rows($r) > 0) {
// ...
}
// 有效率的:
$r = mysql_query("SELECT 1 FROM user WHERE country = ‘China‘ LIMIT 1");
if (mysql_num_rows($r) > 0) {
// ...
}
4. 為搜尋欄位建索引
索引並不一定就是給主鍵或是唯一的欄位。如果在你的表中,有某個欄位你總要會經常用來做搜尋,那麼,請為其建立索引吧。
從你可以看到那個搜尋字串 “last_name LIKE ‘a%‘”,一個是建了索引,一個是沒有索引,效能差了4倍左右。
另外,你應該也需要知道什麼樣的搜尋是不能使用正常的索引的。例如,當你需要在一篇大的文章中搜尋一個詞時,如: “WHERE post_content LIKE ‘%apple%‘”,索引可能是沒有意義的。你可能需要使用MySQL全文索引 或是自己做一個索引(比如說:搜尋關鍵詞或是Tag什麼的)
5. 在Join表的時候使用相當類型的例,並將其索引
如果你的應用程式有很多 JOIN 查詢,你應該確認兩個表中Join的欄位是被建過索引的。這樣,MySQL內部會啟動為你最佳化Join的SQL語句的機制。
而且,這些被用來Join的欄位,應該是相同的類型的。例如:如果你要把 DECIMAL 欄位和一個 INT 欄位Join在一起,MySQL就無法使用它們的索引。對於那些STRING類型,還需要有相同的字元集才行。(兩個表的字元集有可能不一樣)
// 在state中尋找company
$r = mysql_query("SELECT company_name FROM users
LEFT JOIN companies ON (users.state = companies.state)
WHERE users.id = $user_id");
// 兩個 state 欄位應該是被建過索引的,而且應該是相當的類型,相同的字元集。
6. 千萬不要 ORDER BY RAND()
想打亂返回的資料行?隨機挑一個資料?真不知道誰發明了這種用法,但很多新手很喜歡這樣用。但你確不瞭解這樣做有多麼可怕的效能問題。
如果你真的想把返回的資料行打亂了,你有N種方法可以達到這個目的。這樣使用只讓你的資料庫的效能呈指數級的下降。這裡的問題是:MySQL會不得不去執行RAND()函數(很耗CPU時間),而且這是為了每一行記錄去記行,然後再對其排序。就算是你用了Limit 1也無濟於事(因為要排序)
下面的樣本是隨機挑一條記錄
// 千萬不要這樣做:
$r = mysql_query("SELECT username FROM user ORDER BY RAND() LIMIT 1");
// 這要會更好:
$r = mysql_query("SELECT count(*) FROM user");
$d = mysql_fetch_row($r);
$rand = mt_rand(0,$d[0] - 1);
$r = mysql_query("SELECT username FROM user LIMIT $rand, 1");
7. 避免 SELECT *
從資料庫裡讀出越多的資料,那麼查詢就會變得越慢。並且,如果你的資料庫伺服器和WEB伺服器是兩台獨立的伺服器的話,這還會增加網路傳輸的負載。
所以,你應該養成一個需要什麼就取什麼的好的習慣。
// 不推薦
$r = mysql_query("SELECT * FROM user WHERE user_id = 1");
$d = mysql_fetch_assoc($r);
echo "Welcome {$d[‘username‘]}";
// 推薦
$r = mysql_query("SELECT username FROM user WHERE user_id = 1");
$d = mysql_fetch_assoc($r);
echo "Welcome {$d[‘username‘]}";
8. 永遠為每張表設定一個ID
我們應該為資料庫裡的每張表都設定一個ID做為其主鍵,而且最好的是一個INT型的(推薦使用UNSIGNED),並設定上自動增加的 AUTO_INCREMENT標誌。
就算是你 users 表有一個主鍵叫 “email”的欄位,你也別讓它成為主鍵。使用 VARCHAR 類型來當主鍵會使用得效能下降。另外,在你的程式中,你應該使用表的ID來構造你的資料結構。
而且,在MySQL資料引擎下,還有一些操作需要使用主鍵,在這些情況下,主鍵的效能和設定變得非常重要,比如,叢集,分區……
在這裡,只有一個情況是例外,那就是“關聯表”的“外鍵”,也就是說,這個表的主鍵,通過若干個別的表的主鍵構成。我們把這個情況叫做“外鍵”。比如:有一個“學生表”有學生的ID,有一個“課程表”有課程ID,那麼,“成績表”就是“關聯表”了,其關聯了學生表和課程表,在成績表中,學生ID和課程ID叫“外鍵”其共同組成主鍵。
9. 使用 ENUM 而不是 VARCHAR
ENUM 類型是非常快和緊湊的。在實際上,其儲存的是 TINYINT,但其外表上顯示為字串。這樣一來,用這個欄位來做一些選項列表變得相當的完美。
如果你有一個欄位,比如“性別”,“國家”,“民族”,“狀態”或“部門”,你知道這些欄位的取值是有限而且固定的,那麼,你應該使用 ENUM 而不是 VARCHAR。
MySQL也有一個“建議”(見第十條)告訴你怎麼去重新組織你的表結構。當你有一個 VARCHAR 欄位時,這個建議會告訴你把其改成 ENUM 類型。使用 PROCEDURE ANALYSE() 你可以得到相關的建議。
10. 從 PROCEDURE ANALYSE() 取得建議
PROCEDURE ANALYSE() 會讓 MySQL 幫你去分析你的欄位和其實際的資料,並會給你一些有用的建議。只有表中有實際的資料,這些建議才會變得有用,因為要做一些大的決定是需要有資料作為基礎的。
例如,如果你建立了一個 INT 欄位作為你的主鍵,然而並沒有太多的資料,那麼,PROCEDURE ANALYSE()會建議你把這個欄位的類型改成 MEDIUMINT 。或是你使用了一個 VARCHAR 欄位,因為資料不多,你可能會得到一個讓你把它改成 ENUM 的建議。這些建議,都是可能因為資料不夠多,所以決策做得就不夠准。
在phpmyadmin裡,你可以在查看錶時,點擊 “Propose table structure” 來查看這些建議
一定要注意,這些只是建議,只有當你的表裡的資料越來越多時,這些建議才會變得準確。一定要記住,你才是最終做決定的人。
11. 儘可能的使用 NOT NULL
除非你有一個很特別的原因去使用 NULL 值,你應該總是讓你的欄位保持 NOT NULL。這看起來好像有點爭議,請往下看。
首先,問問你自己“Empty”和“NULL”有多大的區別(如果是INT,那就是0和NULL)?如果你覺得它們之間沒有什麼區別,那麼你就不要使用NULL。(你知道嗎?在 Oracle 裡,NULL 和 Empty 的字串是一樣的!)
不要以為 NULL 不需要空間,其需要額外的空間,並且,在你進行比較的時候,你的程式會更複雜。 當然,這裡並不是說你就不能使用NULL了,現實情況是很複雜的,依然會有些情況下,你需要使用NULL值。
下面摘自MySQL自己的文檔:
“NULL columns require additional space in the row to record whether their values are NULL. For MyISAM tables, each NULL column takes one bit extra, rounded up to the nearest byte.”
12. Prepared Statements
Prepared Statements很像預存程序,是一種運行在背景SQL語句集合,我們可以從使用 prepared statements 獲得很多好處,無論是效能問題還是安全問題。
Prepared Statements 可以檢查一些你綁定好的變數,這樣可以保護你的程式不會受到“SQL注入式”攻擊。當然,你也可以手動地檢查你的這些變數,然而,手動的檢查容易出問題,而且很經常會被程式員忘了。當我們使用一些framework或是ORM的時候,這樣的問題會好一些。
在效能方面,當一個相同的查詢被使用多次的時候,這會為你帶來可觀的效能優勢。你可以給這些Prepared Statements定義一些參數,而MySQL只會解析一次。
雖然最新版本的MySQL在傳輸Prepared Statements是使用二進位形勢,所以這會使得網路傳輸非常有效率。
當然,也有一些情況下,我們需要避免使用Prepared Statements,因為其不支援查詢快取。但據說版本5.1後支援了。
在PHP中要使用prepared statements,你可以查看其使用手冊:mysqli 擴充 或是使用資料庫抽象層,如: PDO.
// 建立 prepared statement
if ($stmt = $mysqli->prepare("SELECT username FROM user WHERE state=?")) {
// 綁定參數
$stmt->bind_param("s", $state);
// 執行
$stmt->execute();
// 綁定結果
$stmt->bind_result($username);
// 移動遊標
$stmt->fetch();
printf("%s is from %sn", $username, $state);
$stmt->close();
}
13. 無緩衝的查詢
正常的情況下,當你在當你在你的指令碼中執行一個SQL語句的時候,你的程式會停在那裡直到沒這個SQL語句返回,然後你的程式再往下繼續執行。你可以使用無緩衝查詢來改變這個行為。
關於這個事情,在PHP的文檔中有一個非常不錯的說明: mysql_unbuffered_query() 函數:
“mysql_unbuffered_query() sends the SQL query query to MySQL without automatically fetching and buffering the result rows as mysql_query() does. This saves a considerable amount of memory with SQL queries that produce large result sets, and you can start working on the result set immediately after the first row has been retrieved as you don‘t have to wait until the complete SQL query has been performed.”
上面那句話翻譯過來是說,mysql_unbuffered_query() 發送一個SQL語句到MySQL而並不像mysql_query()一樣去自動fethch和緩衝結果。這會相當節約很多可觀的記憶體,尤其是那些會產生大量結果的查詢語句,並且,你不需要等到所有的結果都返回,只需要第一行資料返回的時候,你就可以開始馬上開始工作於查詢結果了。
然而,這會有一些限制。因為你要麼把所有行都讀走,或是你要在進行下一次的查詢前調用 mysql_free_result() 清除結果。而且, mysql_num_rows() 或 mysql_data_seek() 將無法使用。所以,是否使用無緩衝的查詢你需要仔細考慮。
14. 把IP地址存成 UNSIGNED INT
很多程式員都會建立一個 VARCHAR(15) 欄位來存放字串形式的IP而不是整形的IP。如果你用整形來存放,只需要4個位元組,並且你可以有定長的欄位。而且,這會為你帶來查詢上的優勢,尤其是當你需要使用這樣的WHERE條件:IP between ip1 and ip2。
我們必需要使用UNSIGNED INT,因為 IP地址會使用整個32位的無符號整形。
而你的查詢,你可以使用 INET_ATON() 來把一個字串IP轉成一個整形,並使用 INET_NTOA() 把一個整形轉成一個字串IP。在PHP中,也有這樣的函數 ip2long() 和 long2ip()。
1 $r = "UPDATE users SET ip = INET_ATON(‘{$_SERVER[‘REMOTE_ADDR‘]}‘) WHERE user_id = $user_id";
15. 固定長度的表會更快
如果表中的所有欄位都是“固定長度”的,整個表會被認為是 “static” 或 “fixed-length”。 例如,表中沒有如下類型的欄位: VARCHAR,TEXT,BLOB。只要你包括了其中一個這些欄位,那麼這個表就不是“固定長度靜態表”了,這樣,MySQL 引擎會用另一種方法來處理。
固定長度的表會提高效能,因為MySQL搜尋得會更快一些,因為這些固定的長度是很容易計算下一個資料的位移量的,所以讀取的自然也會很快。而如果欄位不是定長的,那麼,每一次要找下一條的話,需要程式找到主鍵。
並且,固定長度的表也更容易被緩衝和重建。不過,唯一的副作用是,固定長度的欄位會浪費一些空間,因為定長的欄位無論你用不用,他都是要分配那麼多的空間。
使用“垂直分割”技術(見下一條),你可以分割你的表成為兩個一個是定長的,一個則是不定長的。
16. 垂直分割
“垂直分割”是一種把資料庫中的表按列變成幾張表的方法,這樣可以降低表的複雜度和欄位的數目,從而達到最佳化的目的。(以前,在銀行做過項目,見過一張表有100多個欄位,很恐怖)
樣本一:在Users表中有一個欄位是家庭地址,這個欄位是可選欄位,相比起,而且你在資料庫操作的時候除了個人資訊外,你並不需要經常讀取或是改寫這個欄位。那麼,為什麼不把他放到另外一張表中呢? 這樣會讓你的表有更好的效能,大家想想是不是,大量的時候,我對於使用者表來說,只有使用者ID,使用者名稱,口令,使用者角色等會被經常使用。小一點的表總是會有好的效能。
樣本二: 你有一個叫 “last_login” 的欄位,它會在每次使用者登入時被更新。但是,每次更新時會導致該表的查詢快取被清空。所以,你可以把這個欄位放到另一個表中,這樣就不會影響你對使用者識別碼,使用者名稱,使用者角色的不停地讀取了,因為查詢快取會幫你增加很多效能。
另外,你需要注意的是,這些被分出去的欄位所形成的表,你不會經常性地去Join他們,不然的話,這樣的效能會比不分割時還要差,而且,會是極數級的下降。
17. 拆分大的 DELETE 或 INSERT 語句
如果你需要在一個線上的網站上去執行一個大的 DELETE 或 INSERT 查詢,你需要非常小心,要避免你的操作讓你的整個網站停止相應。因為這兩個操作是會鎖表的,表一鎖住了,別的操作都進不來了。
Apache 會有很多的子進程或線程。所以,其工作起來相當有效率,而我們的伺服器也不希望有太多的子進程,線程和資料庫連結,這是極大的占伺服器資源的事情,尤其是記憶體。
如果你把你的表鎖上一段時間,比如30秒鐘,那麼對於一個有很高訪問量的網站來說,這30秒所積累的訪問進程/線程,資料庫連結,開啟的檔案數,可能不僅僅會讓你泊WEB服務Crash,還可能會讓你的整台伺服器馬上?熗恕?/p>
所以,如果你有一個大的處理,你定你一定把其拆分,使用 LIMIT 條件是一個好的方法。下面是一個樣本:
while (1) {
//每次只做1000條
mysql_query("DELETE FROM logs WHERE log_date <= ‘2009-11-01‘ LIMIT 1000");
if (mysql_affected_rows() == 0) {
// 沒得可刪了,退出!
break;
}
// 每次都要休息一會兒
usleep(50000);
}
18. 越小的列會越快
對於大多數的資料庫引擎來說,硬碟操作可能是最重大的瓶頸。所以,把你的資料變得緊湊會對這種情況非常有協助,因為這減少了對硬碟的訪問。
參看 MySQL 的文檔 Storage Requirements 查看所有的資料類型。
如果一個表只會有幾列罷了(比如說字典表,配置表),那麼,我們就沒有理由使用 INT 來做主鍵,使用 MEDIUMINT, SMALLINT 或是更小的 TINYINT 會更經濟一些。如果你不需要記錄時間,使用 DATE 要比 DATETIME 好得多。
當然,你也需要留夠足夠的擴充空間,不然,你日後來幹這個事,你會死的很難看,參看Slashdot的例子(2009年11月06 日),一個簡單的ALTER TABLE語句花了3個多小時,因為裡面有一千六百萬條資料。
19. 選擇正確的儲存引擎
在 MySQL 中有兩個儲存引擎 MyISAM 和 InnoDB,每個引擎都有利有弊。酷殼以前文章《MySQL: InnoDB 還是 MyISAM?》討論和這個事情。
MyISAM 適合於一些需要大量查詢的應用,但其對於有大量寫操作並不是很好。甚至你只是需要update一個欄位,整個表都會被鎖起來,而別的進程,就算是讀進程都無法操作直到讀操作完成。另外,MyISAM 對於 SELECT COUNT(*) 這類的計算是超快無比的。
InnoDB 的趨勢會是一個非常複雜的儲存引擎,對於一些小的應用,它會比 MyISAM 還慢。他是它支援“行鎖” ,於是在寫操作比較多的時候,會更優秀。並且,他還支援更多的進階應用程式,比如:事務。
下面是MySQL的手冊
* target=”_blank”MyISAM Storage Engine
* InnoDB Storage Engine
20. 使用一個對象關係映射器(Object Relational Mapper)
使用 ORM (Object Relational Mapper),你能夠獲得可靠的效能增漲。一個ORM可以做的所有事情,也能被手動的編寫出來。但是,這需要一個進階專家。
ORM 的最重要的是“Lazy Loading”,也就是說,只有在需要的去取值的時候才會去真正的去做。但你也需要小心這種機制的副作用,因為這很有可能會因為要去建立很多很多小的查詢反而會降低效能。
ORM 還可以把你的SQL語句打包成一個事務,這會比單獨執行他們快得多得多。
目前,個人最喜歡的PHP的ORM是:Doctrine。
21. 小心“永久連結”
“永久連結”的目的是用來減少重新建立MySQL連結的次數。當一個連結被建立了,它會永遠處在串連的狀態,就算是資料庫操作已經結束了。而且,自從我們的Apache開始重用它的子進程後——也就是說,下一次的HTTP請求會重用Apache的子進程,並重用相同的 MySQL 連結。
mysql大記憶體高效能最佳化方案