<?php<br />/**<br /> * 把一個漢字轉為unicode的通用函數,不依賴任何庫,和別的自訂函數,但有條件<br /> * 條件:本檔案以及函數的輸入參數應該用utf-8編碼,不然要加函數轉換<br /> * 其實亦可輕易編寫反向轉換的函數,甚至不局限於漢字,奇怪為什麼PHP沒有現成函數<br /> * @author xieye<br /> *<br /> * @param {string} $word 必須是一個漢字,或代表漢字的一個數組(用str_split切割過)<br /> * @return {string} 一個十進位unicode碼,如4f60,代表漢字 “你”<br /> *<br /> * @example<br /> echo "你 ".getUnicodeFromOneUTF8("你");<br /> echo "<br />";<br /> echo "好 ".getUnicodeFromOneUTF8("好");<br /> echo "<br />";<br /> echo "你好 ".getUnicodeFromOneUTF8("你好");<br /> echo "<br />";<br /> echo "你好嗎 ".getUnicodeFromOneUTF8("你好嗎");<br /> 你 20320<br /> 好 22909<br /> 你好 251503099357000<br /> 你好嗎 4.21952182258E+21<br /> */<br />function getUnicodeFromOneUTF8($word) {<br /> //擷取其字元的內部數組表示,所以本檔案應用utf-8編碼!<br /> if (is_array( $word))<br /> $arr = $word;<br /> else<br /> $arr = str_split($word);<br /> //此時,$arr應類似array(228, 189, 160)<br /> //定義一個Null 字元串儲存<br /> $bin_str = '';<br /> //轉成數字再轉成二進位字串,最後聯合起來。<br /> foreach ($arr as $value)<br /> $bin_str .= decbin(ord($value));<br /> //此時,$bin_str應類似111001001011110110100000,如果是漢字"你"<br /> //正則截取<br /> $bin_str = preg_replace('/^.{4}(.{4}).{2}(.{6}).{2}(.{6})$/','$1$2$3', $bin_str);</p><p> //此時, $bin_str應類似0100111101100000,如果是漢字"你"<br /> return bindec($bin_str);<br /> //返回類似20320, 漢字"你"<br /> //return dechex(bindec($bin_str));<br /> //如想返回十六進位4f60,用這句<br />}<br />echo "你 ".getUnicodeFromOneUTF8("你");<br />echo "<br />";<br />echo "好 ".getUnicodeFromOneUTF8("好");<br />echo "<br />";<br />echo "你好 ".getUnicodeFromOneUTF8("你好");<br />echo "<br />";<br />echo "你好嗎 ".getUnicodeFromOneUTF8("你好嗎");<br />exit;</p><p>?>