使用Curl進行抓取遠程內容時url中文編碼問題 轉載

來源:互聯網
上載者:User

標籤:style   blog   http   io   ar   os   使用   for   on   

PHP中對於URL進行編碼,可以使用 urlencode() 或者 rawurlencode(),二者的區別是前者把空格編碼為 ‘+‘,而後者把空格編碼為 ‘%20‘,不過應該注意的是,在編碼時應該只對部分URL編碼,否則URL中的冒號和反斜線也會被轉義。下面是詳細解釋:

string urlencode( string str)

返回字串,此字串中除了 -_. 之外的所有非字母數字字元都將被替換成百分比符號(%)後跟兩位十六進位數,空格則編碼為加號(+)。

例子 1 :urlencode函數與rawurlencode函數區別

$str=‘博 客‘;echo urlencode($str);echo "<br>";echo rawurlencode($str);

url結果:

%B2%A9+%BF%CD%B2%A9%20%BF%CD

例子 2 :url中文編碼方法
從url:"http://www.baidu.com/s?wd=博 客" 轉為 url:"http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2";

$url=‘http://www.baidu.com/s?wd=博 客‘;$arr=explode(‘=‘,$url);$url=$arr[0].‘=‘.rawurlencode($arr[1]);echo $url;

結果:

http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2

或許用以下url編碼函數

function cn_urlencode($url){     $pregstr = "/[\x{4e00}-\x{9fa5}]+/u";//UTF-8中文正則    if(preg_match_all($pregstr,$url,$matchArray)){//匹配中文,返回數組        foreach($matchArray[0] as $key=>$val){            $url=str_replace($val, urlencode($val), $url);//將轉譯替換中文        }        if(strpos($url,‘ ‘)){//若存在空格            $url=str_replace(‘ ‘,‘%20‘,$url);        }    }    return $url;}

url結果:

http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2

轉載:水平凡‘s Blog » 使用Curl進行抓取遠程內容時url中文編碼問題

使用Curl進行抓取遠程內容時url中文編碼問題 轉載

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.