Infobright裡面支援所有的MySQL原有的資料類型。其中Integer類型比其他資料類型更加高效。儘可能使用以下的資料類型:
TINYINT,SMALLINT,MEDIUMINT,INT,BIGINT
DECIMAL盡量減少小數點位元)
DATE ,TIME
效率比較低的、不推薦使用的資料類型有:
BINARY VARBINARY
FLOAT
DOUBLE
VARCHAR
TINYTEXT TEXT
Infobright資料類型使用的一些經驗和注意點:
1)Infobright的數實值型別的範圍和MySQL有點不一樣,比如Infobright的Int的最小值是-2147483647,而MySQl的Int最小值應該是-2147483648。其他的數實值型別都存在這樣的問題。
2)能夠使用小資料類型就使用小資料類型,比如能夠使用SMALLINT就不適用INT,這一點上Infobright和MySQL保持一致。
3)避免效率低的資料類型,像TEXT之類能不用就不用,像FLOAT盡量用DECIMAL代替,但是需要權衡畢竟DECIMAL會損失精度。
4)盡量少用VARCHAR,在MySQL裡面動態Varchar效能就不強,所以盡量避免VARCHAR。如果適合的話可以選擇把VARCHAR改成CHAR儲存甚至專程INTEGER類型。VARCHAR的優勢在於分配空間的長度可變,既然Infobright具有那麼優秀的壓縮效能,個人認為完全可以把VARCHAR轉成CHAR。CHAR會具有更好的查詢和壓縮效能。
5)能夠使用INT的情況盡量使用INT,很多時候甚至可以把一些CHAR類型的資料往整型轉化。比如搜尋日誌裡面的客戶永久id、客戶id等等資料就可以用BIGINT儲存而不用CHAR儲存。其實把時間分割成year、month、day三列儲存也是很好的選擇。在我能見到的系統裡面時間基本上是使用頻率最高的欄位,提高時間欄位的查詢效能顯然是非常重要的。當然這個還是要根據系統的具體情況,做資料分析時有時候很需要MySQL的那些時間函數。
6)varchar和char欄位還可以使用comment lookup,comment lookup能夠顯著地提高壓縮比率和查詢效能。
原文標題:http://blog.chinaunix.net/u2/72637/showart_2306106.html