今天要學習的是一個簡單的小偷程式,那什麼是小偷程式呢?
什麼是小偷程式?顧名思義,小偷就是偷東西的,而程式就是電腦用的。合起來也很好理解:就是使用程式技術,在未經來源站點同意的情況下,拿取該站公開免費的資料的程式。這種資料都是免費面向廣大公眾的,不會涉及到法律問題。
用小偷程式的優點有:無須維護網站,因為小偷程式中的資料來自其他網站,它將隨著該網站的更新而更新;可以節省伺服器資源,一般小偷程式就幾個檔案,50k以內,所有網頁內容都是來自其他網站。
看到這個標題你可千萬別誤會,這裡所說的“小偷”指的是利用ASP 或PHP等強大功能,把遠程網站上的資料(圖片,網頁及其他檔案)抓取到本地,經過各種處理後顯示到自己的頁面上或者儲存進資料庫的一類程式。
你可以通過這種小偷程式,完成過去一些似乎完全不可能實現的任務,比如說把某個站的頁面偷梁換柱後變成自己的頁面,或者把某個站的一些資料(文章,圖片)儲存到本機資料庫中加以利用。“小偷”的優點有:如果你的站被百度等搜尋收入那麼在短期內你的網站訪問是會有很大提高且無須維護網站。減少運行成本,因為小偷程式中的資料來自其他網站,它將隨著該網站的更新而更新;可以節省大量的伺服器資源,一般小偷程式就幾個檔案,所有網頁內容都是來自其他網站。
首先介紹一下小偷程式中將要用到的一些主要知識點。
第一個就是Regex,Regex是用於描述字元排列和匹配模式的一種文法規則。它主要用於字串的模式分隔、匹配、尋找及替換操作。
這裡就先不詳細講Regex的規則,在後面會單獨寫一下Regex的規則,一切事物都有其兩面性,Regex也一樣,其功能很強大,但是也比較發麻。
下一個來講講幾個主要的函數:
Ereg(Regex,內容,返回的數組);
如果省略了第三個參數,該函數會返回true或者false,當找到與Regex匹配的內容是返回true,沒找到是返回false 。
File_get_contents(‘doc.txt’,r);
意思是以唯讀方式讀取doc.txt檔案的全部內容,它相當於上一節所講的兩個函數的和,即:
$rf = fopen(‘doc.txt’,r);
Fread($rf,fsize(‘doc.txt’));