php解決DOM亂碼的方法

來源:互聯網
上載者:User
最近在工作的時候遇到一個問題,在使用DOM的時候,發現了亂碼的問題,後來通過尋找網上的資料終於解決了,現在將解決的方法分享給大家,感興趣的朋友們可以參考借鑒,有需要的朋友們下面來一起學習學習吧。

前言

DOM是php比較新的xml和html處理類,可以像javascript那樣方便的操作DOM樹,網上更多的是介紹它處理XML的情況,今天這篇文章就介紹下php解決DOM亂碼的方法,下面話不多說,直接看下面的解決方案。

解決方案如下

/** * 請求url頁面資訊 * @param str $url * @return str mixed|boolean */function curl_get($url) {  $curl = curl_init();  curl_setopt($curl, CURLOPT_URL, $url);  curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);  //302跳轉  curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);  curl_setopt($curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:47.0) Gecko/20100101 Firefox/47.0');  curl_setopt($curl, CURLOPT_REFERER, $url);  $data = curl_exec($curl);  $code = curl_getinfo($curl,CURLINFO_HTTP_CODE); //輸出請求狀態代碼  curl_close($curl);  if(200 == $code) {    //解決亂碼    if (preg_match('#<meta[^>]*charset="?gb2312"[^>]*>#', $data)) {      $data = iconv("gb2312","utf-8//IGNORE",$data);      $data = preg_replace('#<meta[^>]*charset="?gb2312"[^>]*>#is', '<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">', $data);    }    if (!preg_match('#<meta charset="utf-8"[^>]*>#is', $data)) {      $data = str_replace('<head>', '<head><meta http-equiv="Content-Type" content="text/html;charset=UTF-8">', $data);    }    if (preg_match('#<meta charset="utf-8"[^>]*>#is', $data)) {      $data = preg_replace('#<meta charset="utf-8"[^>]*>#is', '<meta http-equiv="Content-Type" content="text/html;charset=UTF-8">', $data);    }    return $data;  } else {    return false;  }}

/** * 擷取 DOMDocument 對象 * @param str $url * @return boolean|DOM */function getDom($url) {  $html_content = curl_get($url);  if(empty($html_content)) {    //saveLog($url, '請求失敗');    return false;  }  $dom = new DOMDocument('1.0', 'utf-8');  libxml_use_internal_errors(true);  $dom->loadHTML($html_content);  return $dom;}

$html_content = mb_convert_encoding($html_content, 'UTF-8', 'gb2312');

以上就是本文的全部內容,希望對大家的學習有所協助。


聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.