php 不同編碼下的字串長度區分

來源:互聯網
上載者:User

UTF-8的中文字串是三個位元組 複製代碼 代碼如下:<?php
//編碼UTF-8
echo strlen('測試文字a測試文字');
echo '-';
echo mb_strlen('測試文字a測試文字','utf-8');
?>
輸出:25-9

GB2312的中文字串是二個位元組
複製代碼 代碼如下:<?php
//編碼GB2312
echo strlen('測試文字a測試文字');
echo '-';
echo mb_strlen('測試文字a測試文字','Gb2312');
?>

輸出:17-9
在Mysql資料庫(5.1以後的版本)中,如果欄位類型為varchar(10)則可插入10個字元(不是位元組);
所以在判斷字串的長度時需要根據文檔編碼來區分。
符一個簡單的UTF-8下字串截取(按字元個數截取) 複製代碼 代碼如下:<?
/*
* UTF-8字串截取
* $str 要截取的字串
* $start 截取起始位置
* $length 截取長度
*/
function cutStr($str,$start,$length) {
$restr = '';
$j = 0;
$end = $length + $start - 1;
$plen = strlen($str);
for($i=0;$i<$plen;$i++) {
$restr .= ord($str[$i])>127 ? $str[$i].$str[++$i].$str[++$i] : $str[$i];
$j++;
if ($j < $start){$restr = '';}
if ($j >= $end){break;}
}
$restr .='';
return $restr;
}
$str = '中新網9月24日電 二十國集團(G20)領導人第三次金融峰會今日將在美國匹茲堡召開。';
echo $str;
echo '<br>';
echo utf8_substr($str,0,25);
echo '<br>';
?>

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.