上一節中,我們使用DOM方式解析xml文檔,該方式比較符合我們日常思維方式,容易上手,但是它直接把文檔調入記憶體中,比較耗記憶體。在這裡我們可以用另外一種方式解析xml,這個就是SAX方式。
SAX即是:Simple API for XML
SAX是基於事件驅動的。當然android的事件機制是基於回呼函數的,在用SAX解析xml文檔時候,在讀取到文檔開始和結束標籤時候就會回調一個事件,在讀取到其他節點與內容時候也會回調一個事件。
既然涉及到事件,就有事件來源,事件處理器。在SAX介面中,事件來源是org.xml.sax包中的XMLReader,它通過parser()方法來解析XML文檔,併產生事件。事件處理器是org.xml.sax包中ContentHander、DTDHander、ErrorHandler,以及EntityResolver這4個介面
XMLReader通過相應事件處理器註冊方法setXXXX()來完成的與ContentHander、DTDHander、ErrorHandler,以及EntityResolver這4個介面的串連,詳細介紹請見下表:
但是我們無需都繼承這4個介面,SDK為我們提供了DefaultHandler類來處理,DefaultHandler類的一些主要事件回調方法如下:
由以上可知,我們需要XmlReader 以及DefaultHandler來配合解析xml。
處理思路是:
1:建立SAXParserFactory對象
2: 根據SAXParserFactory.newSAXParser()方法返回一個SAXParser解析器
3:根據SAXParser解析器擷取事件來源對象XMLReader
4:執行個體化一個DefaultHandler對象
5:串連事件來源對象XMLReader到事件處理類DefaultHandler中
6:調用XMLReader的parse方法從輸入源中擷取到的xml資料
7:通過DefaultHandler返回我們需要的資料集合。
代碼如下:
View Code
public List<River> parse(String xmlPath){
List<River> rivers=null;
SAXParserFactory factory=SAXParserFactory.newInstance();
try {
SAXParser parser=factory.newSAXParser();
//擷取事件來源
XMLReader xmlReader=parser.getXMLReader();
//設定處理器
RiverHandler handler=new RiverHandler();
xmlReader.setContentHandler(handler);
//解析xml文檔
//xmlReader.parse(new InputSource(new URL(xmlPath).openStream()));
xmlReader.parse(new InputSource(this.context.getAssets().open(xmlPath)));
rivers=handler.getRivers();
} catch (ParserConfigurationException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (SAXException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
return rivers;
}
重點在於DefaultHandler對象中對每一個元素節點,屬性,常值內容,文檔內容進行處理。
前面說過DefaultHandler是基於事件處理模型的,基本處理方式是:當SAX解析器導航到文檔開始標籤時回調startDocument方法,導航到文檔結束標籤時回調endDocument方法。當SAX解析器導航到元素開始標籤時回調startElement方法,導航到其常值內容時回調characters方法,導航到標籤結束時回調endElement方法。
根據以上的解釋,我們可以得出以下處理xml文檔邏輯:
1:當導航到文檔開始標籤時,在回呼函數startDocument中,可以不做處理,當然你可以驗證下UTF-8等等。
2:當導航到rivers開始標籤時,在回調方法startElement中可以執行個體化一個集合用來存貯list,不過我們這裡不用,因為在建構函式中已經執行個體化了。
3:導航到river開始標籤時,就說明需要執行個體化River對象了,當然river標籤中還有name ,length屬性,因此執行個體化River後還必須取出屬性值,attributes.getValue(NAME),同時賦予river對象中,同時添加為導航到的river標籤添加一個boolean為真的標識,用來說明導航到了river元素。
4:當然有river標籤內還有子標籤(節點),但是SAX解析器是不知道導航到什麼標籤的,它只懂得開始,結束而已。那麼如何讓它認得我們的各個標籤呢?當然需要判斷了,於是可以使用回調方法startElement中的參數String localName,把我們的標籤字串與這個參數比較下,就可以了。我們還必須讓SAX知道,現在導航到的是某個標籤,因此添加一個true屬性讓SAX解析器知道。因此
5:它還會導航到文本內標籤,(就是<img></img>裡面的內容),回調方法characters,我們一般在這個方法中取出就是<img></img>裡面的內容,並儲存。
6:當然它是一定會導航到結束標籤</river> 或者</rivers>的,如果是</river>標籤,記得把river對象添加進list中。如果是river中的子標籤</introduction>,就把前面設定標記導航到這個標籤的boolean標記設定為false.
按照以上實現思路,可以實現如下代碼:
View Code
/**導航到開始標籤觸發**/
public void startElement (String uri, String localName, String qName, Attributes attributes){
String tagName=localName.length()!=0?localName:qName;
tagName=tagName.toLowerCase().trim();
//如果讀取的是river標籤開始,則執行個體化River
if(tagName.equals(RIVER)){
isRiver=true;
river=new River();
/**導航到river開始節點後**/
river.setName(attributes.getValue(NAME));
river.setLength(Integer.parseInt(attributes.getValue(LENGTH)));
}
//然後讀取其他節點
if(isRiver){
if(tagName.equals(INTRODUCTION)){
xintroduction=true;
}else if(tagName.equals(IMAGEURL)){
ximageurl=true;
}
}
}
/**導航到結束標籤觸發**/
public void endElement (String uri, String localName, String qName){
String tagName=localName.length()!=0?localName:qName;
tagName=tagName.toLowerCase().trim();
//如果讀取的是river標籤結束,則把River添加進集合中
if(tagName.equals(RIVER)){
isRiver=true;
rivers.add(river);
}
//然後讀取其他節點
if(isRiver){
if(tagName.equals(INTRODUCTION)){
xintroduction=false;
}else if(tagName.equals(IMAGEURL)){
ximageurl=false;
}
}
}
//這裡是讀取到節點內容時候回調
public void characters (char[] ch, int start, int length){
//設定屬性值
if(xintroduction){
//解決null問題
river.setIntroduction(river.getIntroduction()==null?"":river.getIntroduction()+new String(ch,start,length));
}else if(ximageurl){
//解決null問題
river.setImageurl(river.getImageurl()==null?"":river.getImageurl()+new String(ch,start,length));
}
}
運行結果如下: