如題這個問題還是讓人比較揪心的。網上也有不少答案,五花八門,不知道誰對誰錯。個人認為有幾篇文章處理的這個問題還不錯,現總結如下:
第一篇:
c#串連MySQL解決漢字亂碼
突然發現我的資料表中,有漢字的部分均是亂碼,英文正常,遂懷疑是編碼問題。
同事的工作,使用http發送utf-8編碼的漢字,伺服器程式可正確接收和存入資料庫,讀取,均正確。
資料表配置為utf-8
一開始以為本地語言編碼格式問題,對字串進行編碼,如;
string str = "漢字編碼";
byte[] bytes = Encoding.UTF8.GetBytes(str);
string newstr = Encoding.UTF8.GetString(bytes);
之後調試無用。
後在資料庫連接時,添加:
MySQLCommand setformat = new MySQLCommand("set names gb2312",m_Connection);
setformat.ExecuteNonQuery();
setformat.Dispose();
搞定。
一開始不清楚為什麼,因為整個資料庫的預設配置都是utf-8,而且同事在使用http協議傳送utf-8的漢字時,是正確的執行了的。
於是找 set names XX命令的解釋,發現一篇說的比較明白的,轉載了。
【以下部分為轉載】
還有一篇關於Apache和PHP編碼的:http://www.phpchina.com/bbs/thread-13860-1-1.html
近來接受BBT的培訓,做一個投票系統。系統代碼倒不是很難,但是我的時間主要花費在了研究字元集和編碼上面。MySQL和Apache兩個系統的編碼(字元集)問題讓我費勁腦筋,吃盡苦頭。網上對這些問題的解決比較零散,比較片面,大部分是提供解決方案,卻不說為什麼。於是我將這幾天收穫總結一下,避免後來者再走彎路。這篇文章對PHP編寫有一點協助(看完你就知道,怎樣讓你的PHP程式在大部分空間供應商的伺服器裡顯示正常),但是更多協助在於網路伺服器的架設和設定。
先說MySQL的字元集問題。Windows下可通過修改my.ini內的[code]# CLIENT SECTION
[mysql]
default-character-set=utf8
# SERVER SECTION
[mysqld]
default-character-set=utf8[/code]這兩個欄位來更改資料庫的預設字元集。第一個是用戶端預設的字元集,第二個是伺服器端預設的字元集。假設我們把兩個都設為utf8,然後在MySQL Command Line Client裡面輸入“show variebles like“character_set_%”;”,可看到如下字元:
character_set_client latin1
character_set_connection latin1
character_set_database utf8
character_set_results latin1
character_set_server utf8
character_set_system utf8
其中的utf8隨著我們上面的設定而改動。此時,要是我們通過採用UTF-8的PHP程式從資料庫裡讀取資料,很有可能是一串“?????”或者是其他亂碼。網上查了半天,解決辦法倒是簡單,在串連資料庫之後,讀取資料之前,先執行一項查詢“SET NAMES UTF8”,即在PHP裡為[code]mysql_query("SET NAMES UTF8");[/code]即可顯示正常(只要資料庫裡資訊的字元正常)。為什麼會這樣?這句查詢“SET NAMES UTF8”到底是什麼作用?
到MySQL命令列輸入“SET NAMES UTF8;”,然後執行“show variebles like“character_set_%”;”,發現原來為latin1的那些變數“character_set_client”、“character_set_connection”、“character_set_results”的值全部變為utf8了,原來是這3個變數在搗蛋。查閱手冊,上面那句等於:[code]SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;[/code]看看這3個變數的作用:
資訊輸入路徑:client→connection→server;
資訊輸出路徑:server→connection→results。
換句話說,每個路徑要經過3次改變字元集編碼。以出現亂碼的輸出為例,server裡utf8的資料,傳入connection轉為latin1,傳入results轉為latin1,utf-8頁面又把results轉過來。如果兩種字元集不相容,比如latin1和utf8,轉化過程就為無法復原的,破壞性的。所以就轉不回來了。
但這裡要聲明一點,“SET NAMES UTF8”作用只是臨時的,MySQL重啟後就恢複預設了。
接下來就說到MySQL在伺服器上的配置問題了。豈不是我們每次對資料庫讀寫都得加上“SET NAMESUTF8”,以保證資料轉送的編碼一致?能不能通過配置MySQL來達到那三個變數預設就為我們要想的字元集?手冊上沒說,我在網上也沒找到答案。所以,從伺服器配置的角度而言,是沒辦法省略掉那行代碼的。
總結:為了讓你的網頁能在更多的伺服器上正常地顯示,還是加上“SET NAMES UTF8”吧,即使你現在沒有加上這句也能正常訪問。
問題多多,多謝指正!
【】
但是我發現,我在把 set names gb2312 修改成為 utf8,卻無法寫入漢字了,漢字欄位為空白,不清楚是為什麼
第二篇 C#開發MySQL中文亂碼的妙招
以下的文章主要介紹的是C#開發MySQL中文亂碼的正確處理方案的介紹,其中包括對其開發環境,相關的問題描述,以及在C#開發MySQL中文亂碼處理中需要插入測試資料代碼的描述,以下就是文章的主要內容描述。
開發環境:
- vs 2008+easyphp5.3.0+win7
問題描述:在MySQL中插入的中文顯示為問號,讀出也顯示為問號
- C#訪問資料庫用的組件是MySQL.Data.dll(5.0.8.1)
測試用建表代碼如下(注意建庫的時候把整理改成utf8_general_ci):
- CREATE TABLE TT (
- id smallint(6) NOT NULL DEFAULT '1',
- name varchar(64) NOT NULL,
- descr varchar(64) DEFAULT NULL,
- PRIMARY KEY (id)
- )
C#開發MySQL中文亂碼處理中需要插入測試資料代碼:
- insert into config TT('4','呵呵','哈哈')
C#程式碼:查詢部分代碼
- MySQLConnection con = new MySQLConnection("server=127.0.0.1;uid=root;pwd=;database=test;Charset=utf8");
- con.Open();
- DataSet ds = new DataSet();
- MySQLDataAdapter adp = new MySQLDataAdapter("select * from TT",con);
- adp.Fill(ds);
- con.Close();
- dataGridView1.DataSource = ds.Tables[0];
插入部分代碼:
插入部分代碼
- MySQLConnection con = new MySQLConnection("server=127.0.0.1;uid=root;pwd=;database=test;Charset=utf8");
- con.Open();
- string sql = "insert into config TT('4','呵呵','哈哈')";
- MySQLCommand cmd = new MySQLCommand(sql,con);
- cmd.ExecuteNonQuery();
- con.Close();
最終效果如:
上述的相關內容就是對C#開發MySQL中文亂碼處理的描述,希望會給你帶來一些協助在此方面。
第三篇
C#操作MySQL中文亂碼的解決方案
誤區:
近幾天來搜尋網上資源介紹理論上的可選編碼方案為:gb2312/gbk/utf8等支援雙位元組的編碼類別型均可,實際實驗過程中發現並不是這樣的。
A、大家跟風都想使用utf8,但UTF8在處理中文時並非想像中的理想,Select/Update/Insert均出現亂碼;
B、gbk字元集遠大於gb2312,是第二首選字元集,但在Server/Database設定為GBK字元集後,在程式中串連都不成功(not support),更不用說操作;
最終解決方案:
1、選用gb2312編碼
2、設定my.ini檔案中的預設編碼
分別在[mysql]和[mysqld]配置段中增加或修改default_charater_set=gb2312
3、建立資料庫時編碼選用gb2312
4、建立表時編碼選用gb2312,Collation選用gb2312_chines_ci(gb2312_bin沒有去實驗)
5、針對具體需要存放中文的欄位設定編碼選用gb2312,Collation選用gb2312_chines_ci(gb2312_bin沒有去實驗)
改進:
如果確實需要存放gbk編碼字元,請在串連成功後執行set names gbk
而我遇到的問題採用第二篇的方法,在連接字串的後面加上Charset=utf8 就OK了
"server=127.0.0.1;uid=root;pwd=;database=test;Charset=utf8"