php抓取並儲存網站圖片的實現代碼_php技巧

來源:互聯網
上載者:User

此程式實現了網頁原始碼捕獲,圖片連結擷取、分析、並將同樣的圖片連結合并功能,實現了圖片抓取功能。利用php強大的網路內容處理函數將指定的網站上的所有圖片抓取下來,儲存在目前的目錄下,以下為代碼:

<?php /*完成網頁內容捕獲功能*/ function get_img_url($site_name){  $site_fd = fopen($site_name, "r");  $site_content = "";  while (!feof($site_fd)) {   $site_content .= fread($site_fd, 1024);  }  /*利用Regex得到圖片連結*/  $reg_tag = '/<img.*?\"([^\"]*(jpg|bmp|jpeg|gif)).*?>/';  $ret = preg_match_all($reg_tag, $site_content, $match_result);  fclose($site_fd);  return $match_result[1]; }  /* 對圖片連結進行修正 */ function revise_site($site_list, $base_site){  foreach($site_list as $site_item) {   if (preg_match('/^http/', $site_item)) {    $return_list[] = $site_item;   }else{    $return_list[] = $base_site."/".$site_item;  }  }  return $return_list; }  /*得到圖片名字,並將其儲存在指定位置*/ function get_pic_file($pic_url_array, $pos){  $reg_tag = '/.*\/(.*?)$/';  $count = 0;  foreach($pic_url_array as $pic_item){   $ret = preg_match_all($reg_tag,$pic_item,$t_pic_name);   $pic_name = $pos.$t_pic_name[1][0];   $pic_url = $pic_item;  print("Downloading ".$pic_url." ");   $img_read_fd = fopen($pic_url,"r");   $img_write_fd = fopen($pic_name,"w");   $img_content = "";   while(!feof($img_read_fd)){    $img_content .= fread($img_read_fd,1024);      }   fwrite($img_write_fd,$img_content);   fclose($img_read_fd);   fclose($img_write_fd);   print("[OK] ");  }  return 0; }  function main(){ /* 待抓取圖片的網頁地址 */  $site_name = "http://www.jb51.net/sheying/391528.html";  $img_url = get_img_url($site_name);  $img_url_revised = revise_site($img_url, $site_name);  $img_url_unique = array_unique($img_url_revised); //unique array  get_pic_file($img_url_unique,"./"); }  main(); ?> 

此程式還有待完善的地方是,如果圖片在網站伺服器上不同目錄下但檔案名稱是相同的,此時圖片有可能是不一樣的,但在最後儲存時,後面得到的圖片會將前面已經儲存的圖片覆蓋掉,解決方案是在每次儲存前先檢索目前的目錄下是否已有此檔案名稱,有的話對將要儲存的圖片重新命名即可。

以上就是為大家分享的php抓取並儲存網站圖片的方法,以及在實踐過程中修正程式不完善的地方,希望這篇文章對大家的學習有所協助。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.