PHP小偷程式原理和執行個體

來源:互聯網
上載者:User

今天要學習的是一個簡單的小偷程式,那什麼是小偷程式呢?

什麼是小偷程式?顧名思義,小偷就是偷東西的,而程式就是電腦用的。合起來也很好理解:就是使用程式技術,在未經來源站點同意的情況下,拿取該站公開免費的資料的程式。這種資料都是免費面向廣大公眾的,不會涉及到法律問題。
用小偷程式的優點有:無須維護網站,因為小偷程式中的資料來自其他網站,它將隨著該網站的更新而更新;可以節省伺服器資源,一般小偷程式就幾個檔案,50k以內,所有網頁內容都是來自其他網站。

看到這個標題你可千萬別誤會,這裡所說的“小偷”指的是利用ASP 或PHP等強大功能,把遠程網站上的資料(圖片,網頁及其他檔案)抓取到本地,經過各種處理後顯示到自己的頁面上或者儲存進資料庫的一類程式。

你可以通過這種小偷程式,完成過去一些似乎完全不可能實現的任務,比如說把某個站的頁面偷梁換柱後變成自己的頁面,或者把某個站的一些資料(文章,圖片)儲存到本機資料庫中加以利用。“小偷”的優點有:如果你的站被百度等搜尋收入那麼在短期內你的網站訪問是會有很大提高且無須維護網站。減少運行成本,因為小偷程式中的資料來自其他網站,它將隨著該網站的更新而更新;可以節省大量的伺服器資源,一般小偷程式就幾個檔案,所有網頁內容都是來自其他網站。

首先介紹一下小偷程式中將要用到的一些主要知識點。

第一個就是Regex,Regex是用於描述字元排列和匹配模式的一種文法規則。它主要用於字串的模式分隔、匹配、尋找及替換操作。

這裡就先不詳細講Regex的規則,在後面會單獨寫一下Regex的規則,一切事物都有其兩面性,Regex也一樣,其功能很強大,但是也比較發麻。

下一個來講講幾個主要的函數:

Ereg(Regex,內容,返回的數組);

如果省略了第三個參數,該函數會返回true或者false,當找到與Regex匹配的內容是返回true,沒找到是返回false 。

File_get_contents(‘doc.txt’,r);

意思是以唯讀方式讀取doc.txt檔案的全部內容,它相當於上一節所講的兩個函數的和,即:

$rf = fopen(‘doc.txt’,r);

Fread($rf,fsize(‘doc.txt’));

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.