HTTrack(網站複製機制一)

來源:互聯網
上載者:User

標籤:運算式   代理   ack   萬用字元   簡單   wildcards   wildcard   抓取   efi   

 

1、今天爭取把這個工具的所有操作都羅列出來

    首先開啟kali 中的這個工具 Web資訊收集工具HTTrack ,會直接出現出現使用文法。

   對於傳統的像存在Robots.txt的網站,如果程式啟動並執行時候不做限制,在預設的環境下程式不會把網站鏡像,簡單來說HTTPrack跟隨基本的JavaScript或者APPLet、flash中的連結,對於複雜的連結(使用函數和運算式建立的連結)或者伺服器端的ImageMap則不能鏡像。

2、將一般的參數選項做個解釋

      Enter project name  //輸入項目名稱, 程式會自動產生一個本地項目名稱

      Enter URLs (separated by commas or blank spaces)  //欲抓取的網站地址 

    注意的是 Action中的參數操作:

(enter) 1 Mirror Web Site(s)   鏡像網站
2 Mirror Web Site(s) with Wizard  鏡像網站和嚮導
3 Just Get Files Indicated  只獲得檔案中聲明的檔案
4 Mirror ALL links in URLs (Multiple Mirror)   在URl中所有的連結 多鏡
5 Test Links In URLs (Bookmark Test)    書籤測試
0 Quit    退出

Proxy (return=none) : 如果沒有代理 不選擇代理

You can define wildcards, like: -*.gif +www.*.com/*.zip -*img_*.zip
Wildcards (return=none) :      
//使用萬用字元下載,我直接斷行符號

3、對HTTPrack的安裝,如果是kali 則系統直接整合了該工具,LinuX或者其他麒麟系統沒有的可以使用 apt -get install 安裝

4、具體扒皮一個網站如下

 

HTTrack(網站複製機制一)

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.