PHP編碼轉換函式mb_convert_encoding與iconv用法

來源:互聯網
上載者:User

將一個簡訊介面代碼從apache遷移到nginx+php-fpm後,發現無法發出簡訊了,查看php日誌,

[25-Sep-2014 20:15:21] WARNING: [pool www] child 9617 said into stderr: “NOTICE: PHP message: PHP Fatal error:  Call to undefined function mb_convert_encoding() in /data/htdocs/xx.php on line 13″

發現函數mb_convert_encoding沒定義,看著像某個模組沒裝,google了把,要裝個mbstring擴充,之前都是一下裝好多擴充(雖然不知道這個擴充是幹啥的,按照網路文檔來),現在是要應用需要哪個裝哪個,逼格略有提高(至少這樣能讓我知道哪個模組是幹啥的)。

mb-convert-encoding
string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding = mb_internal_encoding() ] )

將 string 類型 str 的字元編碼從可選的 from_encoding 轉換到 to_encoding。

官網文檔  http://php.net/manual/zh/function.mb-convert-encoding.php 需要安裝mbstring擴充庫,如果已經編譯好的php可以這樣熱編譯下

 代碼如下 複製代碼


cd /tmp/php-5.3.28/ext/mbstring/
usr/local/services/php/bin/phpize
./configure --with-php-config=/usr/local/services/php/bin/php-config
make && make install
vim /usr/local/services/php/etc/php.ini
extension="/usr/local/services/php/lib/php/extensions/no-debug-non-zts-20090626/mbstring.so";
 iconv
string iconv ( string in_charset, string out_charset, string str )

iconv函數庫能夠完成各種字元集間的轉換
注意:第二個參數,除了可以指定要轉化到的編碼以外,還可以增加兩個尾碼://TRANSLIT 和 //IGNORE,其中 //TRANSLIT 會自動將不能直接轉化的字元變成一個或多個近似的字元,//IGNORE 會忽略掉不能轉化的字元,而預設效果是從第一個非法字元截斷。
Returns the converted string or FALSE on failu

官網地址  http://php.net/manual/zh/book.iconv.php

已經安裝好php的,同樣也可以使用上面的方法安裝iconv模組

mb_convert_encoding例子
mb_convert_encoding這個函數是用來轉換編碼的。英文一般不會存在編碼問題,只有中文資料才會有這個問題。比如你用Zend Studio或Editplus寫程式時,用的是gbk編碼,如果資料需要入資料庫,而資料庫的編碼為utf8時,這時就要把資料進行編碼轉換,不然進到資料庫就會變成亂碼

 
做一個GBK To UTF-8

 代碼如下 複製代碼
<?php
header(“content-Type: text/html; charset=Utf-8″);
echo mb_convert_encoding(“???S我的友仔”, “UTF-8″, “GBK”);
?>

再來個GB2312 To Big5

 代碼如下 複製代碼

<?php
header(“content-Type: text/html; charset=big5″);
echo mb_convert_encoding(“你是我的朋友”, “big5″, “GB2312″);
?>

mb_strtolower() – 使字串小寫
mb_strtoupper() – 使字串大寫
strtolower() – 將字串轉化為小寫
strtoupper() – 將字串轉化為大寫
ucfirst() – 將字串的首字母轉換為大寫
ucwords() – 將字串中每個單詞的首字母轉換為大寫
 

iconv例子

把gb2312置換成utf-8:

 代碼如下 複製代碼

$text=iconv("GB2312","UTF-8",$text);

在用$text=iconv(“UTF-8″,”GB2312″,$text)過程中,如果遇到一些特別字元時,如:”—”,英文名中的”.”等等字元,轉換就斷掉了。這些字元後的文字都沒法繼續轉換了。

針對這的問題,可以用如下代碼實現:

 代碼如下 複製代碼

$text=iconv("UTF-8","GBK",$text);

你沒有看錯,就這麼簡單,不使用gb2312,而寫成GBK,就可以了。

還有一種方法,第二個參數,加上//IGNORE,忽略錯誤,如下:

 代碼如下 複製代碼

iconv("UTF-8","GB2312//IGNORE",$data);

一般情況下用 iconv,只有當遇到無法確定原編碼是何種編碼,或者iconv轉化後無法正常顯示時才用mb_convert_encoding 函數。

 代碼如下 複製代碼


$content = iconv("GBK", "UTF-8″, $content);
$content = mb_convert_encoding($content, "UTF-8″, "GBK");

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.