使用Curl進行抓取遠程內容時url中文編碼問題樣本探討_PHP教程

來源:互聯網
上載者:User
PHP中對於URL進行編碼,可以使用 urlencode() 或者 rawurlencode(),二者的區別是前者把空格編碼為 '+',而後者把空格編碼為 '%20',不過應該注意的是,在編碼時應該只對部分URL編碼,否則URL中的冒號和反斜線也會被轉義。下面是詳細解釋:
複製代碼 代碼如下:
string urlencode( string str)

返回字串,此字串中除了 -_. 之外的所有非字母數字字元都將被替換成百分比符號(%)後跟兩位十六進位數,空格則編碼為加號(+)。
例子 1 :urlencode函數與rawurlencode函數區別
複製代碼 代碼如下:
$str='博 客';
echo urlencode($str);
echo "
";
echo rawurlencode($str);

url結果:
複製代碼 代碼如下:
%B2%A9+%BF%CD
%B2%A9%20%BF%CD

例子 2 :url中文編碼方法
從url:"http://www.baidu.com/s?wd=博 客" 轉為 url:"http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2";
複製代碼 代碼如下:
$url='http://www.baidu.com/s?wd=博 客';
$arr=explode('=',$url);
$url=$arr[0].'='.rawurlencode($arr[1]);
echo $url;

結果:
http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2
或許用以下url編碼函數
複製代碼 代碼如下:
function cn_urlencode($url){
$pregstr = "/[\x{4e00}-\x{9fa5}]+/u";//UTF-8中文正則
if(preg_match_all($pregstr,$url,$matchArray)){//匹配中文,返回數組
foreach($matchArray[0] as $key=>$val){
$url=str_replace($val, urlencode($val), $url);//將轉譯替換中文
}
if(strpos($url,' ')){//若存在空格
$url=str_replace(' ','%20',$url);
}
}
return $url;
}

url結果:
http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2

http://www.bkjia.com/PHPjc/824958.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/824958.htmlTechArticlePHP中對於URL進行編碼,可以使用 urlencode() 或者 rawurlencode(),二者的區別是前者把空格編碼為 '+',而後者把空格編碼為 '%20',不過應該注意的...

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.