DOM文檔操作和XML檔案互相轉換的java實現 (轉貼)

來源:互聯網
上載者:User
dom|xml|轉換 DOM文檔操作和XML檔案互相轉換的java實現

[ 作者: 郭洪鋒   添加時間: 2001-10-19 8:16:09 ]




郭洪鋒 (ghf_email@sohu.com)

簡介:該文簡要描述了DOM的概念和內部邏輯結構,給出了DOM文檔操作和XML檔案互相轉換的java實現過程。
1. DOM簡介
目前,W3C已於2000年11月13日推出了規範DOM level 2。文件物件模型(DOM)是HTML和XML文檔的編程介面規範,它與平台和語言是無關的,因而可以用各種語言在各種平台上實現。該模型定義了THML和XML檔案在記憶體中的邏輯結構(即為文檔),提供了訪問、存取THML和XML檔案的方法。利用DOM規範,可以實現DOM 文檔和XML之間的相互轉換,遍曆、操作相應DOM文檔的內容。可以說,要自由的操縱XML檔案,就要用到DOM規範。

2. DOM內部邏輯結構
DOM文檔中的邏輯結構可以用節點樹的形式進行表述。通過對XML檔案的解析處理,XML檔案中的元素便轉化為DOM文檔中的節點對象。DOM的文檔節點有Document、Element、Comment、Type等等節點類型,其中每一個DOM文檔必須有一個Document節點,並且為節點樹的根節點。它可以有子節點,或者葉子節點如Text節點、Comment節點等。任何的格式良好的XML檔案中的每一個元素均有DOM文檔中的一個節點類型與之對應。利用DOM介面將XML檔案轉化成DOM文檔後,我們就可以自由的處理XML檔案了。

3. java中的DOM介面
DOM規範提供的API的規範,目前Sun公司推出的jdk1.4測試版中的java API遵循了 DOM level 2 Core推薦介面的語義說明,提供了相應的java語言的實現。

在org.xml.dom中,jkd1.4提供了Document、DocumentType、Node、NodeList、Element、Text等介面,這些介面均是訪問DOM文檔所必須的。我們可以利用這些介面建立、遍曆、修改DOM文檔。

在javax.xml.parsers中,jkd1.4提供的DoumentBuilder和DocumentBuilderFactory組合可以對XML檔案進行解析,轉換成DOM文檔。

在javax.xml.transform.dom和javax.xml.transform.stream中,jdk1.4提供了DOMSource類和StreamSource類,可以用來將更新後的DOM文檔寫入產生的XML檔案中。

4. 常式

4.1 將XML檔案轉化成DOM文檔
這個過程是獲得一個XML檔案解析器,解析XML檔案轉化成DOM文檔的過程。

Jdk1.4中,Document介面描述了對應於整個XML檔案的文檔樹,提供了對文檔資料的訪問,是該步驟的目標。Document介面可以從類DocumentBuilder中擷取,該類包含了從XML文檔獲得DOM文檔執行個體的API。XML的解析器可以從類DocumentBuilderFactory中擷取。在jdk1.4中,XML檔案轉化成DOM文檔可以有如下代碼實現:
//獲得一個XML檔案的解析器
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
//解析XML檔案產生DOM文檔的介面類,以便訪問DOM。
DocumentBuilder builder = factory.newDocumentBuilder();
document = builder.parse( new File(FileName) );



4.2 遍曆DOM文檔
獲得介面類document執行個體後,可以對DOM的文檔樹進行訪問。要遍曆DOM文檔,首先要獲得Root元素。然後獲得Root元素的子節點列表。這裡通過遞迴的方法實現遍曆的目的。


//獲得Root元素
Element element = document.getDocumentElement();
//獲得Root元素的子節點列表
nodelist = element.getChildNodes();
//用遞迴方法實現DOM文檔的遍曆
GetElement(nodelist);
其中GetElement方法實現如下:
public void GetElement(NodeList nodelist){
Node cnode;
int i,len;
String str;

if(nodelist.getLength() == 0){
// 該節點沒有子節點
return;
}
for(i=0;i 1)
System.out.println("      "+str+" "+len);
}
}
}

注意:上面的代碼只是顯示Node類型和Text類型的對象。它們的類型標識分別是1和3。

4.3 修改DOM文檔
修改DOM文檔的API在DOM level 2 Core規範中做了說明,jkd1.4中的org.xml.dom中實現了這些API。修改DOM文檔操作主要集中在Document、Element、Node、Text等類中,這裡給出的例子中是在解析出的DOM文檔中增加一系列對象,對應與在XML檔案中增加一條記錄。
// 獲得Root對象
Element root = document.getDocumentElement();
// 在DOM文檔中增加一個Element節點
Element booktype = document.createElement("COMPUTES");
//將該節點轉化成root對象的子節點
root.appendChild(cdrom);
//在DOM文檔中增加一個Element節點
Element booktitle = document.createElement("Title");
//將該節點轉化成booktype對象的子節點
booktype.appendChild(booktitle);
//在DOM文檔中增加一個Text節點
Text bookname = document.createTextNode("understand Corba");
//將該節點轉化成bookname對象的子節點
booktitle.appendChild(bookname);



4.4 將DOM文檔轉化成XML檔案
// 獲得將DOM文檔轉化為XML檔案的轉換器,在jdk1.4中,有類TransformerFactory
// 來實現,類Transformer實現轉化API。
TransformerFactory tfactory = TransformerFactory.newInstance();
Transformer transformer = tfactory.newTransformer();
// 將DOM對象轉化為DOMSource類對象,該對象表現為轉化成別的表達形式的資訊容器。

DOMSource source = new DOMSource(document);
// 獲得一個StreamResult類對象,該對象是DOM文檔轉化成的其他形式的文檔的容器,可以是XML檔案,文字檔,HTML檔案。這裡為一個XML檔案。
StreamResult result = new StreamResult(new File(“text.xml”));
// 調用API,將DOM文檔轉化成XML檔案。
transformer.transform(source,result);


這裡提供了該常式的完整程式,該常式在windows 2000中jdk1.4環境中運行通過。

以上給出了一個例子,讀者可以從中瞭解到對DOM操作的思路。因為對DOM的操作均遵循了DOM規範,所以也適用於其它語言對DOM的處理。

參考資料:

http://www.w3.org/TR/2000/REC-DOM-Level-2-Core-2000-1113
Java 2 Platform, Standard Edition, V1.4.0 API Specificaion

關於作者
郭洪鋒:主要從事UNIX系統下分布式應用的開發和研究。您可以通過電子郵件ghf_email@sohu.com 和他聯絡。


相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.