C++解析XML

來源:互聯網
上載者:User
C++解析XML Homepage: http://www.grinninglizard.com/tinyxml/
download:http://sourceforge.net/projects/tinyxml

用mingw32-make前修改一下makefile檔案,改為如下

# DEBUG can be set to YES to include debugging info, or NO otherwise(不是DEBUG)
DEBUG          := NO

# PROFILE can be set to YES to include profiling info, or NO otherwise
PROFILE        := NO

# TINYXML_USE_STL can be used to turn on STL support. NO, then STL
# will not be used. YES will include the STL files.(使用STL,選擇的話,則可以使用std::string)
TINYXML_USE_STL := YES

一、      TinyXml的特點

TinyXml是一個基於DOM模型的、非驗證的輕量級C++解譯器。

1.      SAX和DOM

目前XML的解析主要有兩大模型:SAX和DOM。

其中SAX是基於事件的,其基本工作流程是分析XML文檔,當發現了一個新的元素時,產生一個對應事件,並調用相應的使用者處理函數。這種方式佔用記憶體少,速度快,但使用者程式相應得會比較複雜。

而DOM(文件物件模型),則是在分析時,一次性的將整個XML文檔進行分析,並在記憶體中形成對應的樹結構,同時,向使用者提供一系列的介面來訪問和編輯該樹結構。這種方式佔用記憶體大,速度往往慢於SAX,但可以給使用者提供一個物件導向的提供者,對使用者更為友好。

 

2.      驗證和非驗證

對於一個特定的XML文檔而言,其正確性分為兩個層次。首先是其格式應該符合XML的基本格式要求,比如第一行要有聲明,標籤的嵌套層次必須前後一致等等,符合這些要求的檔案,就是一個合格的XML檔案,稱作well-formatted。但除此之外,一個XML文檔因其內容的不同還必須在語義上符合相應的標準,這些標準由相應的DTD檔案或者Schema檔案來定義,符合了這些定義要求的XML檔案,稱作valid。

因此,解析器也分為兩種,一種是驗證的,即會跟據XML檔案中的聲明,用相應的DTD檔案對XML檔案進行校正,檢查它是否滿足DTD檔案的要求。另一種是忽略DTD檔案,只要基本格式正確,就可以進行解析。

就我所知,驗證的解析器通常都是比較重量級的。TinyXml不支援驗證,但是體積很小,用在解析格式較為簡單的XML檔案,比如設定檔時,特別的合適。

 

二、 TinyXml的構建和使用
1.      擷取

TinyXml首頁在http://www.grinninglizard.com/tinyxml/index.html,從這裡可以找到最新版本的原始碼,目前的版本是 2.4.3 (截至2006.5.17).

2.構建

TinyXml在構建時可以選擇是否支援STL,選擇的話,則可以使用std::string,所以通常應在Windows上,TinyXml的源碼包裡提供了VC6的工程檔案,直接用它就可以產生兩個靜該開啟這個選項。態庫(帶STL和不帶STL),非常容易。唯一需要注意的是,預設產生的庫是單線程的,如果用在多線程的項目中,需要改動一下配置,產生相應的多線程庫。

在Unix平台上,TinyXml的源碼包裡只提供了一個Makefile,對於典型的Linux系統,或裝了gcc和gmake的其他Unix,這個Makefile足夠用了,我在RH9和RHEL4上測試,簡單的make就成功了。需要注意的有以下幾點:預設的編譯是不支援STL的,可以通過編輯Makefile的TINYXML_USE_STL := NO那一行,把NO改成YES就可以支援STL了;還有預設只產生了一個測試程式,沒有產生任何庫,如果要產生靜態庫的話,可以用ar命令,將產生的幾個目標檔案打包就行了,如果要產生動態庫,則需要加上-fpic參數重新編譯。

3.      使用

構建了相應的庫之後,在使用了它們的工程中,只要在串連時把他們連上就行了。需要注意的是,如果需要STL支援,在編譯用到了TinyXml的檔案時,需要定義一個宏TIXML_USE_STL,對gcc,可以使用參數-DTIXML_USE_STL,對cl.exe(VC),可以使用參數/DTIXML_USE_STL,如果嫌麻煩,可以直接定義在 tinyxml.h檔案裡。

 

三、 TinyXml的編程模型

1.類之間的關係

TinyXml實現的時DOM訪問模型,因此提供了一系列的類對應XML檔案中的各個節點。主要類間的關係如所示:

 

 

TiXmlBase:其它類的基類,是個抽象類別

TiXmlNode:表示一個節點,包含節點的一般方法,如訪問自節點、兄弟節點、編輯自身、編輯子節點

TiXmlDocument:表示整個XML文檔,不對應其中某個特定的節點。

TiXmlElement:表示元素節點,可以包含子節點和TiXmlAttribute

TiXmlComment:表示注釋

TiXmlDeclaration:表示聲明

TiXmlText:表示文本節點

TiXmlUnknown:表示未知節點,通常是出錯了

TiXmlAttribute:表示一個元素的屬性

下面是一個簡單的例子:

<?xml version="1.0" encoding="utf-8" ?>

 

 

<!-This is only a sample-->

 

 

<book>

 

 

       <name>TinyXml How To</name>

 

 

       <price unit=”RMB”>20</price>

 

 

       <description>Some words…</description>

 

 

</ book >

 

 

整個文檔,對應TiXmlDocument

book,name,price, description,都對應TiXmlElement

第一行對應一個TiXmlDeclaration

第二行對應一個TiXmlComment

“TinyXml How To”對應一個TiXmlText

unit則是price的一個TiXmlAttribute

這些類與XML檔案中的相應元素都有很好的對應關係,因此相信參照TinyXml的文檔,可以很容易的掌握各個方法的使用。

 

2.  需要注意的問題

各類之間的轉換

 

 

由於各個節點類都從TiXmlNode繼承,在使用時常常需要將TiXmlNode*類型的指標轉換為其衍生類別的指標,在進行這種轉換時,應該首先使用由TiXmlNode類提供的一系列轉換函式,如ToElement(void),而不是c++的dynamic_cast

 

檢查傳回值

 

 

由於TinyXml是一個非校正的解析器,因此當解析一個檔案時,很可能檔案並不包含我們預期的某個節點,在這種情況下,TinyXml將返回null 指標。因此,必須要對傳回值進行檢查,否則將很容易出現記憶體訪問的錯誤。

 

如何重頭建立一個XML檔案

 

 

先建立一個TiXmlDocument對象,然後,載入某個模板,或者直接插入一個節點作為根節點,接著就可以像開啟一個已有的XML檔案那樣對它進行操作了。

 

四、總結

TinyXml最大的特點就是它很小,可以很方便的靜態串連到程式裡。對於像設定檔、簡單的資料檔案這類檔案的解析,它很適合。但是由於它是非驗證的,因此需要在程式裡做許多檢查工做,加重了程式編寫的負擔。因此對於複雜的XML檔案,我覺得最好還是用驗證的解析器來處理。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.