關於php 解決substr()截取中文字元亂碼問題解決方案

來源:互聯網
上載者:User
本篇文章主要介紹了PHP substr()函數,這裡提供代碼執行個體說明當截取中文字串的亂碼問題,有需要的小夥伴可以參考下

在php中如果我要用substr()截取字串全英文的沒問題,如果包括有中文或英文就會悲劇了,但大家也 別切我們可以使用其它辦法來解決。

php截取中文字串出現亂碼,這是最近發現的事情,先前我曾經寫過一篇關於自動產生meta資訊的文章,那篇關於利用php截取文章前多少字作為description方法,但是出現了IE6無法載入CSS的現象,這裡做一個補充。

首先要明確這麼一個問題,之所以會出現IE6偶爾無法載入CSS的現象,是因為檔案出現了亂碼,導致後面的載入CSS的link無法被IE6正確解析。因此就看到了一個純HTML頁面,沒有CSS,赤裸裸!明確了問題,剩下的問題就好解決了,就是防止亂碼,既然萬戈所提供的函數出現了亂碼,就重新去找了一個php函數來解決這個亂碼的問題。

substr()函數可以分割文字,但要分割的文字如果包括中文字元往往會遇到問題。

mb_substr()這個函數的用法與substr()相似,只是在最後要加入多一個參數,以設定字串的編碼。

通過這裡大幾就應該理解我改進萬戈方法的原因了~~

下面再介紹幾個更進階處理辦法

例1

代碼如下

function func_chgtitle($str,$len) { //$length我們允許字串顯示的最大長度  $tmpstr = ""; $strlen = $len; for($i = 0; $i < $strlen; $i++) { if(ord(substr($str, $i, 1)) > 0xa0) { $tmpstr .= substr($str, $i, 2); $i++; } else $tmpstr .= substr($str, $i, 1); } return $tmpstr;}

例2

字串編碼為UTF-8的,一個中文字元佔三個位元組:

public static function chinesesubstr($str, $start, $len) { // $str指字串,$start指字串的起始位置,$len指字串長度

$strlen = $start + $len; // 用$strlen儲存字串的總長度,即從字串的起始位置到字串的總長度

代碼如下

 for($i = $start; $i < $strlen;) { if (ord ( substr ( $str, $i, 1 ) ) > 0xa0) { // 如果字串中首個位元組的ASCII序數值大於0xa0,則表示漢字 $tmpstr .= substr ( $str, $i, 3 ); // 每次取出三位字元賦給變數$tmpstr,即等於一個漢字 $i=$i+3; // 變數自加3 } else{ $tmpstr .= substr ( $str, $i, 1 ); // 如果不是漢字,則每次取出一位字元賦給變數$tmpstr $i++; } } return $tmpstr; // 返回字串 }

總結:以上就是本篇文的全部內容,希望能對大家的學習有所協助。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.