網路爬蟲 - PHP類比網路請求

來源:互聯網
上載者:User
比如我請求百度,我想知道本次共請求了那些資源,包括圖片,JS,CSS,但又不想FILE_GET_CONTENT以後拿這些然後在用正則分析,有更好的辦法嗎?

回複內容:

比如我請求百度,我想知道本次共請求了那些資源,包括圖片,JS,CSS,但又不想FILE_GET_CONTENT以後拿這些然後在用正則分析,有更好的辦法嗎?

沒有這種方法。也許你能找到一個封裝好的對象完成你的需求,但是這個對象的內部必然也是通過分析字串進行統計的。

其實思考一下就知道,你的意圖本身是不符合邏輯的。瀏覽器又怎麼樣,不也是第一部擷取html源碼,然後逐行執行,從而逐個請求css, js, image等資源嗎?這才是符合事物規律的邏輯,就像是問你一棟樓有多少層,唯一的辦法就是數一數,也許有一些儀器能算出來,但是儀器的工作原理也是一層一層的數。

程式是建立在邏輯的基礎上的,開發功能的時候可以不用別人造好的輪子,但是不等於你可以抹殺那個輪子所代表的邏輯。

無論用哪種方式,都要稍微做一些工作的。

建議使用 simplehtmldom

  • 相關文章

    聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.