【java】html解析

來源:互聯網
上載者:User

一、首推Jsoup(憑直接首推的,對該類庫不熟悉)

中文文檔: http://www.open-open.com/jsoup/parsing-a-document.htm

Jsoup使用:  http://www.iteye.com/topic/1010581

最簡單實用: http://hongmin118.iteye.com/blog/1229705

/**     * 解析一個html字串,只得到此字串中的文本     * @param html     * @return     */    public static String html2txt(String html) {        //<span style="color: rgb(229, 51, 51); background-color: rgb(0, 153, 0); font-weight: bold; font-style: italic; text-decoration: underline;">測試1</span>        Document document = Jsoup.parse(html);        String content = document.text();        return content;    }

自己的代碼:

//讀取了html的全部文字部分,沒有標籤//data可以是不完整的html頁面資料Document doc = Jsoup.parse(data);text = doc.text();//擷取全部圖片標籤media = doc.select("img[src]");//擷取標籤的連結String imgurl = src.attr("abs:src");

 

二、htmlparser

使用:http://free0007.iteye.com/blog/1131163

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.