自訂HTMLParser的複合標籤

最後更新：2018-12-04 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

import org.htmlparser.nodes.TagNode;

/**
* Title: Link標籤解析類
* Description: 
* Copyright: Copyright (c) 2006
* Company: 用於解析HTML檔案的Link標籤
* 例如：解析"<head><link href='/Skin/DefaultSkin.css' rel='stylesheet' type='text/css'>..."
* getAttribute("rel") == "stylesheet"
* getLink() == "當前路徑/Skin/DefaultSkin.css"
* getType() == "text/css"
* 
* @author not attributable
* @version 1.0
*/

public class LinkTypeTag extends TagNode {
    private static final String[] mIds = {"Link"};
    private static final String[] mEndTagEnders = {"head"};
    public String[] getIds() {
        return (mIds);
    }
    public String[] getEndTagEnders() {
        return (mEndTagEnders);
    }

    public String[] getEnders() {
    return super.getEnders();
    }

    public String getAttribute(String strTag) {
        return super.getAttribute(strTag);
    }

public String getLink() {
 return getPage().getAbsoluteURL(super.getAttribute("href"));
 }
 public String getType() {
 return super.getAttribute("type");
 }
}
 HTMLParser將一個文檔分成三種節點分別是：Remark（注釋）；Text（文本）；Tag（標籤）。而標籤又分成兩種分別是簡單標籤（Tag）和複合標籤（CompositeTag），像<img> 這種標籤稱為簡單標籤，因為標籤不會再包含其它內容。而像<a href="xxxx">Home</a>這種類型的標籤，因為標籤會嵌套文本或者其他標籤的稱為複合標籤，也就是對應著CompositeTag這個類。簡單標籤的實作類別很簡單，只需要擴充Tag類並覆蓋getIds方法以返回標籤的識別文本，例如<img>標籤應該返回包含"img"字串的數組，具體的代碼可以參考HTMLParser內建的ImageTag標籤類的實現。複合標籤事實上是對簡單標籤的擴充，HTMLParser在處理一個複合標籤時需要知道該標籤的起始標識以及結束標識，也就是我們在前面給出的源碼中的兩個方法getIds和getEnders，一般來講，標籤出現都是成對的，因此這兩個方法一般返回相同的值。另外一個方法getEndTagEnders，這個方法用來返回父一級的標籤名稱，例如<tr>的父一級標籤應該是<table>。這個方法的必要性在於HTML對格式的要求很不嚴格，在很多的HTML文檔中的一些標籤經常是有開始標識，但是沒有結束標識，由於瀏覽器的超強適應能力使這種情況出現的很頻繁，因此HTMLParser利用這個方法來輔助判斷一個標籤是否已經結束。

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

自訂HTMLParser的複合標籤

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support