著作權聲明:原創作品,允許轉載,轉載時請務必以超連結形式標明文章原始出版、作者資訊和本聲明。否則將追究法律責任。http://blog.csdn.net/mayongzhan - 馬永占,myz,mayongzhan
<?php
/** * @name 採集後的處理.php * @date Sat Dec 22 02:07:45 CST 2007 * @copyright 馬永占(MyZ) * @author 馬永占(MyZ) * @link http://blog.csdn.net/mayongzhan/ */ //採集後的檔案,然後那來進行處理.這裡的東西讓我抄了5本書,是哪的不方便提供,自己找找吧. header('Content-Type:text/html;charset=utf8'); function writer($content,$url){ $fp = fopen($url, 'ab'); fwrite($fp, $content); fclose($fp); } //從1到136頁的內容一次合并.這個是最爽的... for ($i=1;$i<136;$i++) { $str = file_get_contents('./myz/'.$i.'.shtml'); preg_match("/(<h1>)(.*?)(<//h1>)(.*?)(<div class=/"artibody/" id=/"artibody/">)(.*?)(<//div>)/s",$str,$arr); $arr[6] = preg_replace("/(<span[^>]+>.*?<a[^>]+>)(.*?)(<//a><//span>)/s","$2",preg_replace("/<p>|<//p>/","/r/n",$arr[6])); $result = "/r/n------------------------------------------------/r/n------------------------------------------------/r/n------------------------------------------------/r/n".$i."----------------馬永占的目錄編號:".$arr[2]."/r/n------------------------------------------------/r/n------------------------------------------------/r/n------------------------------------------------/r/n".$arr[6]; writer($result, "./myz/all.txt");}?>