線性表,鏈表,雜湊表是常用的資料結構,在進行Java開發時,JDK已經為我們提供了一系列相應的類來實現基本的資料結構。這些類均在java.util包中。本文試圖通過簡單的描述,向讀者闡述各個類的作用以及如何正確使用這些類。
Collection<br />├List<br />│├LinkedList<br />│├ArrayList<br />│└Vector<br />│ └Stack<br />└Set<br />Map<br />├Hashtable<br />├HashMap<br />└WeakHashMap
Collection介面
Collection是最基本的集合介面,一個Collection代表一組Object,即Collection的元素
(Elements)。一些 Collection允許相同的元素而另一些不行。一些能排序而另一些不行。Java
SDK不提供直接繼承自Collection的類, Java SDK提供的類都是繼承自Collection的“子介面”如List和Set。
所有實現Collection介面的類都必須提供兩個標準的建構函式:無參數的建構函式用於建立一個空的Collection,有一個
Collection參數的建構函式用於建立一個新的
Collection,這個新的Collection與傳入的Collection有相同的元素。後一個建構函式允許使用者複製一個Collection。
如何遍曆Collection中的每一個元素?不論Collection的實際類型如何,它都支援一個iterator()的方法,該方法返回一個迭代子,使用該迭代子即可逐一訪問Collection中每一個元素。典型的用法如下:
Iterator it = collection.iterator(); // 獲得一個迭代子<br /> while(it.hasNext()) {<br /> Object obj = it.next(); // 得到下一個元素<br /> }
由Collection介面派生的兩個介面是List和Set。
用Iterator模式實現遍曆集合
Iterator模式是用於遍曆集合類的標準存取方法。它可以把訪問邏輯從不同類型的集合類中抽象出來,從而避免向用戶端暴露集合的內部結構。
例如,如果沒有使用Iterator,遍曆一個數組的方法是使用索引:
for(int i=0; i<array.size(); i++) { ... get(i) ... }
而訪問一個鏈表(LinkedList)又必須使用while迴圈:
while((e=e.next())!=null) { ... e.data() ... }
奧秘在於用戶端自身不維護遍曆集合的"指標",所有的內部狀態(如當前元素位置,是否有下一個元素)都由Iterator來維護,而這個Iterator由集合類通過Factory 方法產生,因此,它知道如何遍曆整個集合。
用戶端從不直接和集合類打交道,它總是控制Iterator,向它發送"向前","向後","取當前元素"的命令,就可以間接遍曆整個集合。
首先看看java.util.Iterator介面的定義:
public interface Iterator { boolean hasNext(); Object next(); void remove(); }
依賴前兩個方法就能完成遍曆,典型的代碼如下:
for(Iterator it = c.iterator(); it.hasNext(); ) { Object o = it.next(); // 對o的操作... }
在JDK1.5中,還對上面的代碼在文法上作了簡化:
// Type是具體的類型,如String。 for(Type t : c) { // 對t的操作... }
每一種集合類返回的Iterator具體類型可能不同,Array可能返回ArrayIterator,Set可能返回
SetIterator,Tree可能返回TreeIterator,但是它們都實現了Iterator介面,因此,用戶端不關心到底是哪種
Iterator,它只需要獲得這個Iterator介面即可,這就是物件導向的威力。
Iterator源碼剖析
讓我們來看看AbstracyList如何建立Iterator。首先AbstractList定義了一個內部類(inner class):
private class Itr implements Iterator { ... }
而iterator()方法的定義是:
public Iterator iterator() { return new Itr(); }
因此用戶端不知道它通過Iterator it = a.iterator();所獲得的Iterator的真正類型。
現在我們關心的是這個申明為private的Itr類是如何?遍曆AbstractList的:
private class Itr implements Iterator { int cursor = 0; int lastRet = -1; int expectedModCount = modCount; }<br />
Itr類依靠3個int變數(還有一個隱含的AbstractList的引用)來實現遍曆,cursor是下一次next()調用時元素的位置,第一次調用next()將返回索引為0的元素。lastRet記錄上一次遊標所在位置,因此它總是比cursor少1。
變數cursor和集合的元素個數決定hasNext():
public boolean hasNext() { return cursor != size(); }<br />
方法next()返回的是索引為cursor的元素,然後修改cursor和lastRet的值:
public Object next() { checkForComodification(); try { Object next = get(cursor); lastRet = cursor++; return next; } catch(IndexOutOfBoundsException e) { checkForComodification(); throw new NoSuchElementException(); } }
expectedModCount表示期待的modCount值,用來判斷在遍曆過程中集合是否被修改過。AbstractList包含一個
modCount變數,它的初始值是0,當集合每被修改一次時(調用add,remove等方法),modCount加1。因此,modCount如果不
變,表示集合內容未被修改。
Itr初始化時用expectedModCount記錄集合的modCount變數,此後在必要的地方它會檢測modCount的值:
final void checkForComodification() { if (modCount != expectedModCount) throw new ConcurrentModificationException(); }
如果modCount與一開始記錄在expectedModeCount中的值不等,說明集合內容被修改過,此時會拋出ConcurrentModificationException。
這個ConcurrentModificationException是RuntimeException,不要在用戶端捕獲它。如果發生此異常,說明程式碼的編寫有問題,應該仔細檢查代碼而不是在catch中忽略它。
但是調用Iterator自身的remove()方法刪除當前元素是完全沒有問題的,因為在這個方法中會自動同步expectedModCount和modCount的值:
public void remove() { ... AbstractList.this.remove(lastRet); ... // 在調用了集合的remove()方法之後重新設定了expectedModCount: expectedModCount = modCount; ... }
要確保遍曆過程順利完成,必須保證遍曆過程中不更改集合的內容(Iterator的remove()方法除外),因此,確保遍曆可靠的原則是只在一個線程中使用這個集合,或者在多線程中對遍曆代碼進行同步。
最後給個完整的樣本:
Collection c = new ArrayList(); c.add("abc"); c.add("xyz"); for(Iterator it = c.iterator(); it.hasNext(); ) { String s = (String)it.next(); System.out.println(s); }
如果你把第一行代碼的ArrayList換成LinkedList或Vector,剩下的代碼不用改動一行就能編譯,而且功能不變,這就是針對抽象編程的原則:對具體類的依賴性最小。
List介面
List是有序的Collection,使用此介面能夠精確的控制每個元素插入的位置。使用者能夠使用索引(元素在List中的位置,類似於數組下標)來訪問List中的元素,這類似於Java的數組。
和下面要提到的Set不同,List允許有相同的元素。
除了具有Collection介面必備的iterator()方法外,List還提供一個listIterator()方法,返回一個
ListIterator介面,和標準的Iterator介面相比,ListIterator多了一些add()之類的方法,允許添加,刪除,設定元素,
還能向前或向後遍曆。
實現List介面的常用類有LinkedList,ArrayList,Vector和Stack。
LinkedList類
LinkedList實現了List介面,允許null元素。此外LinkedList提供額外的
get,remove,insert方法在
LinkedList的首部或尾部。這些操作使LinkedList可被用作堆棧(stack),隊列(queue)或雙向隊列(deque)。
注意LinkedList沒有同步方法。如果多個線程同時訪問一個List,則必須自己實現訪問同步。一種解決方案是在建立List時構造一個同步的List:
List list = Collections.synchronizedList(new LinkedList(...));
ArrayList類
ArrayList實現了可變大小的數組。它允許所有元素,包括null。ArrayList沒有同步。
size,isEmpty,get,set方法已耗用時間為常數。但是add方法開銷為分攤的常數,添加n個元素需要O(n)的時間。其他的方法已耗用時間為線性。
每個ArrayList執行個體都有一個容量(Capacity),即用於儲存元素的數組的大小。這個容量可隨著不斷添加新元素而自動增加,但是
增長演算法並沒有定義。當需要插入大量元素時,在插入前可以調用ensureCapacity方法來增加ArrayList的容量以提高插入效率。
和LinkedList一樣,ArrayList也是非同步的(unsynchronized)。
Vector類
Vector非常類似ArrayList,但是Vector是同步的。由Vector建立的Iterator,雖然和
ArrayList建立的
Iterator是同一介面,但是,因為Vector是同步的,當一個Iterator被建立而且正在被使用,另一個線程改變了Vector的狀態(例
如,添加或刪除了一些元素)。