mysql寫入中文亂碼,mysql寫入中文
亂碼可謂是程式猿的常見問題了,下面就大致介紹幾種常見的情況。常見於頁面、前台到後台傳值、寫入到資料庫這三個方面。
1.頁面亂碼
頁面相對是最為容易解決的,往往是在相應的jsp頁面或者html版面設定相關的字元集即可。如
<%@page language="java" contentType="text/html; charset=utf-8" pageEncoding="utf-8"%>
2.傳值亂碼
在傳值過程中,也是亂碼出現的頻繁地。先不說到底是什麼情境了,通常常用的方案有如下幾個
配置指定的filter
<!-- 配置請求過濾器,編碼格式設為UTF-8,避免中文亂碼--> <filter> <filter-name>springUtf8Encoding</filter-name> <filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class> <init-param> <param-name>encoding</param-name> <param-value>UTF-8</param-value> </init-param> <init-param> <param-name>forceEncoding</param-name> <param-value>true</param-value> </init-param> </filter>
設定request字元集
往往從前台傳入到對應的controller或者是action之後出現亂碼,講講我一般的思路是先列印request本身預設的字元集
i:System.out.println(request.getCharacterEncoding());
接著按照情況,如果列印的不是所需要的字元集則設定相應字元集即可
ii:request.setCharacterEncoding("UTF-8");
當然某種情況可能還是無法解決這時候用以下這個即可
String str=newString((request.getParameter("bigQuestionTypeName")).getBytes("iso-8859-1"),"utf-8")
3.存入資料庫亂碼
這個相對就比較複雜,這裡lz用的mysql,且以mysql來介紹如何來解決這個亂碼問題
大家都知道,無論是底層使用的是純粹的jdbc還是hibernate還是jpa都好,其實本質上都是jdbc,對應的架構只不過在相關的基礎上進行特定的封裝。所以無論是什麼樣的技術,都會用到串連到資料庫的url。所以url首先是需要檢查的
1.url
標準情況會在相應的後面加上相應的字元集設定,如下
jdbcUrl =jdbc:mysql:///itcastoa?useUnicode=true&characterEncoding=UTF-8
如上,useUnicode就不用說了,串連資料庫中設定的字元集,&這是什麼的?這就有問題了,在xml中&是&的逸出字元。如果你是用xml來配置對應的資料庫連接配置的話就什麼問題了。但是如果用的是**.properties就有問題了,則必須將amp除去即可。這個確實是lz經曆了頭破血流的經驗啊。
2.資料庫
這裡的問題也是相對比較難處理的,登入資料庫
i:查看資料庫編碼格式
可以看到server的字元集還是latin1,這裡就需要講一下常用的字元集了。
為了世界的和平和繁榮昌盛,ISO組織指定了一套unicode字元集方案,Unicode編碼是不同編碼之間相互交流轉換的橋樑,包含了32位二進位,所以能容納2的31次方的字元,有生之年是夠用了。而根據不同的需要Unicode又分為三種方案。
Utf8:用以解決國際上不同語言而出現的編碼。對英文是使用8位,中文則為3位。可以在任何支援utf9字元集的瀏覽器上顯示,無需另行處理。
另外兩種為utf16和32,這裡不再編著。大家自行查閱即可,總的還是因為儲存和使用的方便來決定使用哪種。
好了,另外相對熟悉的就是gbk,俗稱國標碼,中國國家標準來制定,僅僅包含中文字元。所以相對兩講,utf8的相容更好,但是儲存量更大。
馬上回來,大致對字元集充了電還是回來先解決問題。這裡所以用gbk或者utf8都是可以的。但是latin1肯定是不可以的,這裡主要通過這樣一個命令來設定
分別設定設定了伺服器、資料庫和資料表部分的編碼,必須設定串連編碼。串連編碼設定如下:
mysql> SET character_set_client='gbk';
mysql> SET character_set_connection='gbk'
mysql> SET character_set_results='gbk'
設定好編碼,下面便可以成功插入中文了,其實用一句話即可解決
常用命令
查看資料庫編碼格式
show variables like 'character_set_%';
查看資料庫中的表的建立
show create table tablename;
設定資料庫編碼格式
setnames 'gbk';
好了,很晚了,今天的總結就先到這裡,中文亂碼問題算是告一段落,問題不是很大,但是很常見,顆粒歸倉。洗洗睡了。