CI架構源碼閱讀---------Utf8.php
檔案地址:./system/core/Utf8.php
主要作用:提供utf-8編碼的環境支援
1.__construct() 建構函式確定utf8是否被支援
(1)日誌記錄 Utf8 Class Initialized
(2)將CodeIgniter.php中的$CFG調用進當前類。
(3)判斷如果Regex支援utf8,iconv庫已經安裝,多位元組字串函數重載沒有啟用,應用程式字 符集是utf8,那麼
(a)記錄日誌:UTF-8 Support Enabled。
(b)定義常量UTF8_ENABLED 值為 true
(c)如果載入了mbstring擴充我們設定內部編碼
(d)我們會設定一個標記讓我們不用多次使用extension_loaded() 函數
(4)判斷如果Regex不支援utf8或者iconv庫沒有安裝或者多位元組字串函數重載已經啟用或者應用程式字元集不是utf8,那麼
(a)記錄日誌:UTF-8 Support Disabled
(b)設定常量UTF8_ENABLED 為false
2.clean_string() 清理utf8編碼的字串
(1)判斷如果字串不是ASCII碼
(2)使用iconv函數將字串轉碼(關於iconv函數詳情見http://www.php.net/manual/zh/function.iconv.php)
(3)返回字串
3.safe_ascii_for_xml() 刪除所有在xml中可能導致問題的ASCII碼字元,除了水平定位字元,換行,斷行符號。
(1) 直接調用remove_invisible_characters()來刪除無效的字元並返回。
註:remove_invisible_characters 函數在common.php中定義
4.convert_to_utf8() 將字串轉換為utf8編碼
(1)如果iconv函數存在,使用iconv轉換
(2)如果mb_convert_encoding函數存在,使用mb_convert_encoding函數轉換
(3)如果上面兩個函數都不存在則不能轉換返回false
(4)如果轉換完成返迴轉換後的字串
5._is_ascii() 測試一個字串是不是ASCII碼
(1) 使用正則拼配返回測試結果。
item('charset') == 'UTF-8'// Application charset must be UTF-8){log_message('debug', "UTF-8 Support Enabled");define('UTF8_ENABLED', TRUE);// set internal 內部 encoding for multibyte 多位元組 string functions if necessary 必需的// and set a flag so we don't have to repeatedly 多次 use extension_loaded()// or function_exists()if (extension_loaded('mbstring')){define('MB_ENABLED', TRUE);mb_internal_encoding('UTF-8');}else{define('MB_ENABLED', FALSE);}}else{log_message('debug', "UTF-8 Support Disabled");define('UTF8_ENABLED', FALSE);}}// --------------------------------/** * Clean UTF-8 strings * * Ensures 保證 strings are UTF-8 * * @accesspublic * @paramstring * @returnstring */function clean_string($str){if ($this->_is_ascii($str) === FALSE){$str = @iconv('UTF-8', 'UTF-8//IGNORE', $str);}return $str;}// --------------------------------/** * Remove ASCII control characters * * Removes all ASCII control characters except horizontal tabs, * line feeds, and carriage returns, as all others can cause * problems in XML * * @accesspublic * @paramstring * @returnstring */function safe_ascii_for_xml($str){return remove_invisible_characters($str, FALSE);}// --------------------------------/** * Convert to UTF-8 * * Attempts 企圖 to convert a string to UTF-8 * * @accesspublic * @paramstring * @paramstring- input encoding * @returnstring */function convert_to_utf8($str, $encoding){if (function_exists('iconv')){$str = @iconv($encoding, 'UTF-8', $str);}elseif (function_exists('mb_convert_encoding')){$str = @mb_convert_encoding($str, 'UTF-8', $encoding);}else{return FALSE;}return $str;}// --------------------------------/** * Is ASCII? * * Tests if a string is standard 7-bit ASCII or not * * @accesspublic * @paramstring * @returnbool */function _is_ascii($str){return (preg_match('/[^\x00-\x7F]/S', $str) == 0);}// --------------------------------}// End Utf8 Class/* End of file Utf8.php *//* Location: ./system/core/Utf8.php */