PHP 中英文混合排版中處理字串常用的函數

來源:互聯網
上載者:User

# 判斷某個位置是中文字元的左還是右半部分,或不是中文
# 傳回值 -1 左 0 不是中文字元 1 右
# 用法
/*
$a = 'this is 中文';
print is_chinese($a, 1); // 0
print is_chinese($a,8); // -1
print is_chinese($a,9); // 1
*/
function is_chinese(&$str, $location) {
$ch = true;
$i = $location;
while(ord($str[$i])>0xa0 && $i >= 0) {
$ch = !$ch;
$i --;
}

if($i != $location) {
$f_str = $ch ? 1: -1;
}
else {
$f_str = false;
}

return $f_str;
}

# 中文字串倒置函數
# 如果一個將一個有中文的字串用strrev倒過來,就會產生亂碼
/*
print cstrrev('this is 中文'); // 文中 si siht
*/

function cstrrev(&$str) {
$long = strlen($str);
for($f_str='', $chinese=false, $i=$long-1; $i>=0; $i--) {
if(ord($str[$i]) > 0xa0) {
$chinese = ! $chinese;
if($chinese == false) {
$f_str .= $str[$i].$str[$i+1];
}
}
else {
$f_str .= $str[$i];
}
}
return $f_str;
}
/* 中文字串截取函數
一些中文字串截取函數經常有一些問題,例如在一些自動換行程式中
$a=“1中2”;
經兩次截取後,
csubstr($str,$a,0,2);
csubstr($str, $a, 2,2)
由於載取位置指向“中”的右位元組,可能會是這樣的結果
1, 2
用本函數會產生正確的結果
1中, 2
*/
# start 開始位置,從0開始
# long = 0 則從start 一直取到字串尾
# ltor = true 時從左至右取字元,false 時到右到左取字元
# $cn_len 中文字元按位元組取還是字數取,如果按字數取,則一個中文當一個位元組計算

function csubstr(&$str, $start=0, $long=0, $ltor=true, $cn_len=2) {
if($long == 0) $long = strlen($str);
if($ltor == false) $str = cstrrev($str);

if($cn_len == 1) {

for($i=0, $fs=0; $i<$start; $fs++)
$i += (ord($str[$fs]) <= 0xa0) ? 1 : 0.5;
for($i=0, $fe=$fs; $i<$long; $fe++)
$i += (ord($str[$fe]) <= 0xa0) ? 1 : 0.5;
$long = $fe - $fs;

}
else {

$fs = (is_chinese($str, $start) == 1) ? $start - 1 : $start;
$fe = $long + $start - 1;
$end = ( is_chinese($str, $fe) == -1 ) ? $fe -1 : $fe;
$long = $end - $fs + 1;
}

$f_str = substr($str, $fs, $long);
if($ltor == false) $f_str = cstrrev($f_str);

return $f_str;
}

# 取左字串
# 當cn_len == 2 時 $long 取左邊多少個字,反之則取左邊多少個位元組
function cleft(&$str, $long, $cn_len=2) {
$f_str = csubstr($str, 0, $long, true, $cn_len);
return $f_str;
}

# 取右字串
function cright(&$str, $long, $cn_len=2) {
$f_str = cstrrev($str);
$f_str = csubstr($f_str, 0, $long, true, $cn_len);
$f_str = cstrrev($f_str);
return $f_str;
}
# 對含有中文字元的文章分行格式化
# 再也不會發生因換行問題而產生的種種問題啦!!!
# 註:文章的每一行必須用 n (chr(13))進行分行
# $width 每行多少字元
# $br 將 每行用什麼字元當結束符

function ctext_wrap(&$text, $width=60, $br="<BR>") {
$lines = explode("n",$text);
$rows = count($lines);

for($i=0; $i<$rows; $i++) {
$len = strlen($lines[$i]);
for($j=0; $j<$len; $j+=$width) {
$p = $j + $width - 1;
$k = 0;
if($p<$len) {
while(!is_chinese($lines[$i], $p) && $lines[$i][$p] != ' ' && $p>$j) {
$k ++;
$p --;
}
if($p == $j) $k = 0;
}
$f_str .= csubstr($lines[$i], $j, $width-$k) . $br;
$j -= $k;
}
}
return $f_str;
}

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.