標籤:編碼 字元 pos 導致 引用 處理 報錯 不能 中文
關於用戶端和伺服器端的亂碼問題, POSTGRESQL字元集問題總結 總結的很詳細, 特別棒.
這裡讓我頭痛了很久的問題在於 終端
上字元編碼的問題, 由於我的mbp上的 iterm2 的預設編碼為 utf-8, 字元顯示亂碼實際上是由於 iterm2 不能好好顯示 GBK 的編碼導致的. 平時終端中可以顯示中文, 不清楚為何 postgresql shell 中就不行了, 這導致一直沒有想到是終端的問題.
關於中文可以正常顯示, 我的配置如下
1. 安裝 PostgreSQL 的 locale 選擇的是 zh_CN.UTF-82. 用戶端預設編碼為 utf-8, 改為 gbk (\encoding 常看當前用戶端編碼字元集), 有兩種方式可以選擇: * set client_encoding to 'gbk' * \encoding 'gbk'3. 終端 iterm2 字元編碼設定為 'gbk'
引用引文的一個例子
假設服務端編碼為UTF-8,用戶端工具psgl預設為GBK,
在此環境下插入“漢字”,一切正常。此時傳到客戶的“漢字”為GBK編碼,自動轉為UTF-8編碼存到服務端;而查詢時,又自動將服務端的UTF-8編碼轉為GBK來顯示,所以沒有出現亂碼。
將用戶端編碼設定為UTF-8,則剛才插入的“漢字”不能正常顯示。因為此時用戶端和服務端的編碼一樣,在取資料時不進行任何轉換,直接將存在服務端的UTF8編碼的位元組傳到用戶端,之後psgl直接顯示,所以就亂碼了。
此環境下插入“漢字”,則添加不成功,因為“漢字”直接以GBK的形式傳到服務端,UTF8編碼不認識,所以就報錯。(現在用戶端編碼為UTF8,所以提示的中文資訊也亂碼了)。
總結:
1、在此樣本中,應用程式psgl,對所輸入和擷取的字元沒做任何處理,直接顯示,其使用了pg用戶端一樣的編碼方式(GBK)。
2、在使用時盡量保證用戶端編碼和作業系統環境一致,不然顯示和添加就會出現亂碼情況。
PostgreSQL 用戶端亂碼問題