自己寫的php curl庫實現整站複製功能,phpcurl
有時候經常會用到一些線上手冊,比如國內或國外的,有些是訪問速度慢,有些是作者直接吧網站關閉了,有些是伺服器總是宕機,所以還是全盤複製到自己伺服器比較爽。
庫特點:
給定一初始串連,初始連結以下的層級所有檔案會拷貝到本地。
多次複製可以配置是否覆蓋。
可以配置是否下載圖片。
所有連結替換為相對連結,所以可以隨便rewrite。
絕對不會出現檔案覆蓋等問題。
最NB的特點是,沒有比這更NB的庫了。
SVN:http://svn.phpdr.net/repos/ares/php/library/trunk/lib/CurlMulti/MyCurl/Clone.php
幫客之家下載:http://xiazai.jb51.net/201502/other/CurlMulti.rar
複製結果展示(這個複製操作幾秒鐘就完成了):
複製源網站:http://www.laruence.com/manual/
複製結果:http://manual.phpdr.net/yaf/
Demo代碼:
複製代碼 代碼如下:
<?php
class Controller_Spider extends MyYaf_Controller_Base{
function init(){
parent::init();
if(!$this->getRequest()->isCli()){
Ares_Http::error403();
}
include 'CurlMulti/CurlMulti.php';
include 'CurlMulti/MyCurl.php';
include 'phpQuery.php';
}
}
複製代碼 代碼如下:
<?php
class YafdocController extends Controller_Spider {
function init() {
parent::init ();
include 'CurlMulti/MyCurl/Clone.php';
}
function indexAction() {
$url = 'http://www.laruence.com/manual';
$dir = Yaf_Application::app ()->getAppDirectory () . '/data/manual';
$cacheDir = $this->getBaseDir () . '/cache/curl';
if (! is_dir ( $cacheDir )) {
mkdir ( $cacheDir );
}
$curl = new CurlMulti ();
$curl->maxThread = 10;
$curl->cache ['enable'] = true;
$curl->cache ['enableDownload'] = true;
$curl->cache ['dir'] = $cacheDir;
$curl->cache ['compress'] = true;
$clone = new MyCurl_Clone ( $curl, $url, $dir );
$clone->overwrite = true;
$clone->start ();
return false;
}
}
http://www.bkjia.com/PHPjc/957129.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/957129.htmlTechArticle自己寫的php curl庫實現整站複製功能,phpcurl 有時候經常會用到一些線上手冊,比如國內或國外的,有些是訪問速度慢,有些是作者直接吧網...