處理網上爬得資料,需要進行很多的dom、字串等相關的操作,如果用php通過Regex處理的話,正則寫起來複雜且麻煩,很多時候還容易出錯,通過ajax來操作的話,執行效率不好,而且感覺寫起來不順。如果能用jquery來處理的話會非常方便,對於dom操作,屬性的替換、字串的操作都很方便。如果有一個環境能同時解析html文檔(html/javascript/css)和php代碼就好了,不知道有沒有呢?
回複內容:
處理網上爬得資料,需要進行很多的dom、字串等相關的操作,如果用php通過Regex處理的話,正則寫起來複雜且麻煩,很多時候還容易出錯,通過ajax來操作的話,執行效率不好,而且感覺寫起來不順。如果能用jquery來處理的話會非常方便,對於dom操作,屬性的替換、字串的操作都很方便。如果有一個環境能同時解析html文檔(html/javascript/css)和php代碼就好了,不知道有沒有呢?
php和js混起來寫啊
可以用 Nodejs 解析 HTML,產生資料結構(JSON或XML),然後再用 PHP 來來處理後續的部分。
可以用 PHP 調用 Node 進程的方式,不過這樣比較慢
另一種方式就 Node 和 PHP 同時運行,分別做自已的事情(任務隊列)。任務不是一個個有序完成,而是 Node 處理成半成品之後,送到半成品庫,再由 PHP 出庫繼續處理。
http://m.blog.csdn.net/blog/xyzhaopeng_11109/6626340#
你可以混合c,java,,dotnet,php,python,js,css,html,一起用,
沒錯,一起用,你沒看錯,沒有逗你,
這個語言就是
aauto
http://bbs.aau.cn/
樓主應該要找的是PHP的DOM操作庫吧,可以試試simple_html_dom.php
:
http://simplehtmldom.sourceforge.net/manual.htm
比如抓取PHP官網首頁新聞:
find('article.newsentry') as $article) { $item['time'] = trim($article->find('time', 0)->plaintext); $item['title'] = trim($article->find('h2.newstitle', 0)->plaintext); $item['content'] = trim($article->find('div.newscontent', 0)->plaintext); $news[] = $item;}print_r($news);
PHP類似的DOM操作庫還有phpQuery和Ganon,也可以試試:
phpQuery - jQuery port to PHP
https://github.com/TobiaszCudnik/phpquery
Ganon - Fast (HTML DOM) parser written in PHP
https://github.com/Shemahmforash/Ganon
nodejs完全可以代替PHP。
爬資料,為什麼非要用PHP?