MySQL
資料庫編碼問題全面解析 MySQL資料庫的4.1是一個分水嶺,4.1直接支援Unicode,以下版本支援的不好。MySQL JDBC Driver的3.0.16也是一個分水嶺,3.0.16版本會取資料庫本身的編碼,然後按照該編碼轉換,這種方式和Oracle的JDBC Driver是一樣的。例如你的資料庫是GBK編碼的話,JDBC Driver就會把資料庫裡面的取出來的字串按照GBK往unicode轉換,送給JVM。因此正確的設定資料庫本身的編碼就尤為重要。MySQL JDBC Driver3.0.16以下的版本則不然,它不會那麼智能的根據資料庫編碼來確定如何轉換,它總是預設使用ISO8859-1,因此你必須使用 characterEncoding=GBK來強制他把資料庫中取出來的字串按照GBK來往unicode轉換。因此,使用什麼資料庫版本,不管是3.x,還是4.0.x還是4.1.x,其實對我們來說不重要,重要的有二:1) 正確的設定資料庫編碼,MySQL4.0以下版本的字元集總是預設ISO8859-1,MySQL4.1在安裝的時候會讓你選擇。如果你準備使用UTF- 8,那麼在建立資料庫的時候就要指定好UTF-8(建立好以後也可以改,4.1以上版本還可以單獨指定表的字元集)2) 使用3.0.16以上版本的JDBC Driver,那麼你就不需要再寫什麼characterEncoding=UTF-8 這樣,如果,資料庫伺服器使用的是utf-8,那麼,jdbc就會把資料庫的內容用utf-8格式傳到JVM中。而,如果資料庫伺服器中的某個資料庫使用的編碼是gbk,那麼就會發生編碼不一致的錯誤!這時,你可以使?characterEncoding=GBK強制使用gbk編碼傳遞到JVM中。或者,你也可以把整個MySQL資料庫伺服器的編碼轉變為gbk。 在MySQL中,預設使用的是lartin1,也就是ISO8859-1字元集編碼。這是一種8位的編碼,適用於所有西歐字元。而對於漢字等是不合適的。
最好、最通用的編碼格式是utf-8
,這時一種8
位的Unicode
字元集。它對於8
位的西歐字元集來說,比較節省空間的,而又能夠有效地表示漢字等字元。
因此,將MySQL
資料庫伺服器設定為utf-8
格式,把所有的MySQL
資料庫也設定為utf-8
格式,這是最佳的選擇!全世界所有語言都可以很好的得到支援!
但是,一些常用的MySQL工具無法顯示utf-8格式的中文。如,MySQL內建的工具,MySQL-Front等軟體。但是,MyManger和命令列下的MySQL是可以正常顯示utf-8格式的中文的。如果,你選擇使用gbk,那麼就應該把資料庫伺服器和資料庫的編碼格式全部轉為使用gbk,否則可能會出現問題。