map,set,list等集合解析以及HashMap,LinkedHashMap,TreeMap等該選誰的的區別,linkedhashmap轉list
前言:
今天在整理一些資料時,想起了map,set,list等集合,於是就做些筆記,提供給大家學習參考以及自己日後回顧。
首先Map主要用於儲存健值對,根據鍵得到值,因此不允許鍵重複(重複了覆蓋了),但允許值重複。其中最常用的幾種map如下:
Hashmap: 是一個最常用的Map,它根據鍵的HashCode 值儲存資料,根據鍵可以直接擷取它的值,具有很快的訪問速度,遍曆時,取得資料的順序是完全隨機的。HashMap最多隻允許一條記錄的鍵為Null;允許多條記錄的值為 Null;HashMap不支援線程的同步,即任一時刻可以有多個線程同時寫HashMap;可能會導致資料的不一致。如果需要同步,可以用 Collections的synchronizedMap方法使HashMap具有同步的能力,或者使用ConcurrentHashMap。
Hashtable:與 HashMap類似,它繼承自Dictionary類,不同的是:它不允許記錄的鍵或者值為空白;它支援線程的同步,即任一時刻只有一個線程能寫Hashtable,因此也導致了 Hashtable在寫入時會比較慢。
LinkedHashMap:儲存了記錄的插入順序,在用Iterator遍曆LinkedHashMap時,先得到的記錄肯定是先插入的.也可以在構造時用帶參數,按照應用次數排序。在遍曆的時候會比HashMap慢,不過有種情況例外,當HashMap容量很大,實際資料較少時,遍曆起來可能會比LinkedHashMap慢,因為LinkedHashMap的遍曆速度只和實際資料有關,和容量無關,而HashMap的遍曆速度和他的容量有關。
TreeMap:實現SortMap介面,能夠把它儲存的記錄根據鍵排序,預設是按索引值的升序排序,也可以指定排序的比較子,當用Iterator 遍曆TreeMap時,得到的記錄是排過序的。
一般情況下,我們用的最多的是HashMap,HashMap裡面存入的索引值對在取出的時候是隨機的,它根據鍵的HashCode值儲存資料,根據鍵可以直接擷取它的值,具有很快的訪問速度。在Map 中插入、刪除和定位元素,HashMap 是最好的選擇。
TreeMap取出來的是排序後的索引值對。但如果您要按自然順序或自訂順序遍曆索引值,那麼TreeMap會更好。
LinkedHashMap 是HashMap的一個子類,如果需要輸出順序和輸入的順序相同,那麼用LinkedHashMap可以實現,它還可以按讀取順序來排列,像串連池中可以應用。
1. HashSet是通過HashMap實現的,TreeSet是通過TreeMap實現的,只不過Set用的只是Map的key
2. Map的key和Set都有一個共同的特性就是集合的唯一性.TreeMap更是多了一個排序的功能.
3. hashCode和equal()是HashMap用的, 因為無需排序所以只需要關註定位和唯一性即可.
a. hashCode是用來計算hash值的,hash值是用來確定hash表索引的.
b. hash表中的一個索引處存放的是一張鏈表, 所以還要通過equal方法迴圈比較鏈上的每一個對象
才可以真正定位到索引值對應的Entry.
c. put時,如果hash表中沒定位到,就在鏈表前加一個Entry,如果定位到了,則更換Entry中的value,並返回舊value
4. 由於TreeMap需要排序,所以需要一個Comparator為索引值進行大小比較.當然也是用Comparator定位的.
a. Comparator可以在建立TreeMap時指定
b. 如果建立時沒有確定,那麼就會使用key.compareTo()方法,這就要求key必須實現Comparable介面.
c. TreeMap是使用Tree資料結構實現的,所以使用compare介面就可以完成定位了.
注意:
1、Collection沒有get()方法來取得某個元素。只能通過iterator()遍曆元素。
2、Set和Collection擁有一模一樣的介面。
3、List,可以通過get()方法來一次取出一個元素。使用數字來選擇一堆對象中的一個,get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList構造堆棧stack、隊列queue。
5、Map用 put(k,v) / get(k),還可以使用containsKey()/containsValue()來檢查其中是否含有某個key/value。
HashMap會利用對象的hashCode來快速找到key。
* hashing
雜湊碼就是將對象的資訊經過一些轉變形成一個獨一無二的int值,這個值儲存在一個array中。
我們都知道所有儲存結構中,array尋找速度是最快的。所以,可以加速尋找。
發生碰撞時,讓array指向多個values。即,數組每個位置上又產生一個梿表。
6、Map中元素,可以將key序列、value序列單獨抽取出來。
使用keySet()抽取key序列,將map中的所有keys產生一個Set。
使用values()抽取value序列,將map中的所有values產生一個Collection。
為什麼一個產生Set,一個產生Collection?那是因為,key總是獨一無二的,value允許重複。
其次是map,set,list等java中集合解析:
在JAVA的util包中有兩個所有集合的父介面Collection和Map,它們的父子關係:
java.util
+Collection 這個介面extends自 --java.lang.Iterable介面
+List 介面
-ArrayList 類
-LinkedList 類
-Vector 類 此類是實現同步的
+Queue 介面
+不常用,在此不表.
+Set 介面
+SortedSet 介面
-TreeSet 類
-HashSet
+Map 介面
-HashMap 類 (除了不同步和允許使用 null 鍵/值之外,與 Hashtable 大致相同.)
-Hashtable 類 此類是實現同步的,不允許使用 null 索引值
+SortedMap 介面
-TreeMap 類
以下對眾多介面和類的簡單說明:首先不能不先說一下數組(Array)
一、Array , Arrays
Java所有“儲存及隨機訪問一連串對象”的做法,array是最有效率的一種。
1、 效率高,但容量固定且無法動態改變。
array還有一個缺點是,無法判斷其中實際存有多少元素,length只是告訴我們array的容量。
2、Java中有一個Arrays類,專門用來操作array。
arrays中擁有一組static函數,
equals():比較兩個array是否相等。array擁有相同元素個數,且所有對應元素兩兩相等。
fill():將值填入array中。
sort():用來對array進行排序。
binarySearch():在排好序的array中尋找元素。
System.arraycopy():array的複製。
二、Collection , Map
若撰寫程式時不知道究竟需要多少對象,需要在空間不足時自動擴增容量,則需要使用容器類庫,array不適用。
1、Collection 和 Map 的區別
容器內每個為之所儲存的元素個數不同。
Collection類型者,每個位置只有一個元素。
Map類型者,持有 key-value pair,像個小型資料庫。
2、Java2容器類類庫的用途是“儲存對象”,它分為兩類,各自旗下的子類別關係
Collection
--List:它確保維護元素特定的順序.
--ArrayList / LinkedList / Vector
--Set :不能含有重複的元素
--HashSet /TreeSet
Map
--HashMap
--HashTable
--TreeMap
Map----一組成對的“索引值對”對象,即其元素是成對的對象,最典型的應用就是資料字典,並且還有其它廣泛的應用。另外,Map可以返回其所 有鍵組成的Set和其所有值組成的Collection,或其索引值對組成的Set,並且還可以像數組一樣擴充多維Map,只要讓Map中索引值對的每個 “值”是一個Map即可。
Collection下 1.迭代器
迭代器是一種設計模式,它是一個對象,它可以遍曆並選擇序列中的對象,而開發人員不需要瞭解該序列的底層結構。迭代器通常被稱為“輕量級”對象,因為建立它的代價小。
Java中的Iterator功能比較簡單,並且只能單向移動:
(1) 使用方法iterator()要求容器返回一個Iterator。第一次調用Iterator的next()方法時,它返回序列的第一個元素。注意:iterator()方法是java.lang.Iterable介面,被Collection繼承。
(2) 使用next()獲得序列中的下一個元素。
(3) 使用hasNext()檢查序列中是否還有元素。
(4) 使用remove()將迭代器新返回的元素刪除。
Iterator是Java迭代器最簡單的實現,為List設計的ListIterator具有更多的功能,它可以從兩個方向遍曆List,也可以從List中插入和刪除元素。
2.List的功能方法
List(interface): 次序是List最重要的特點;它確保維護元素特定的順序。List為Collection添加了許多方法,使得能夠向List中間插入與移除元素(只推薦 LinkedList使用)。一個List可以產生ListIterator,使用它可以從兩個方向遍曆List,也可以從List中間插入和刪除元素。
ArrayList: 由數組實現的List。它允許對元素進行快速隨機訪問,但是向List中間插入與移除元素的速度很慢。ListIterator只應該用來由後向前遍曆ArrayList,而不是用來插入和刪除元素,因為這比LinkedList開銷要大很多。
LinkedList: 由列表實現的List。對順序訪問進行了最佳化,向List中間插入與刪除得開銷不大,隨機訪問則相對較慢(可用ArrayList代替)。它具有方法 addFirst()、addLast()、getFirst()、getLast()、removeFirst()、removeLast(),這些方 法(沒有在任何介面或基類中定義過)使得LinkedList可以當作堆棧、隊列和雙向隊列使用。
3.Set的功能方法
Set(interface): 存入Set的每個元素必須是唯一的,這也是與List不同的,因為Set不儲存重複元素。加入Set的Object必須定義equals()方法以確保對 象的唯一性。Set與Collection有完全一樣的介面。Set介面不保證維護元素的次序。
HashSet: HashSet能快速定位一個元素,存入HashSet的對象必須定義hashCode()。
TreeSet: 保持次序的Set,底層為樹結構。使用它可以從Set中提取有序的序列。
LinkedHashSet: 具有HashSet的查詢速度,且內部使用鏈表維護元素的順序(插入的次序)。於是在使用迭代器遍曆Set時,結果會按元素插入的次序顯示。
HashSet採用散列函數對元素進行排序,這是專門為快速查詢而設計的;TreeSet採用紅/黑樹狀結構的資料結構進行排序元 素;LinkedHashSet內部使用散列以加快查詢速度,同時使用鏈表維護元素的次序,使得看起來元素是以插入的順序儲存的。需要注意的是,產生自己 的類時,Set需要維護元素的儲存順序,因此要實現Comparable介面並定義compareTo()方法。
4.Map的功能方法
java為資料結構中的映射定義了一個介面java.util.Map;它有四個實作類別,分別是HashMap Hashtable LinkedHashMap 和TreeMap
Map主要用於儲存健值對,根據鍵得到值,因此不允許鍵重複,但允許值重複。
Hashmap 是一個 最常用的Map,它根據鍵的HashCode 值儲存資料,根據鍵可以直接擷取它的值,具有很快的訪問速度。HashMap最多隻允許一條記錄的鍵為Null;允許多條記錄的值為 Null;HashMap不支援線程的同步,即任一時刻可以有多個線程同時寫HashMap;可能會導致資料的不一致。如果需要同步,可以用 Collections的synchronizedMap方法使HashMap具有同步的能力.
Hashtable 與 HashMap類似,不同的是:它不允許記錄的鍵或者值為空白;它支援線程的同步,即任一時刻只有一個線程能寫Hashtable,因此也導致了Hashtale在寫入時會比較慢。
LinkedHashMap儲存了記錄的插入順序,在用Iterator遍曆LinkedHashMap時,先得到的記錄肯定是先插入的.在遍曆的時候會比HashMap慢。
TreeMap能夠把它儲存的記錄根據鍵排序,預設是按升序排序,也可以指定排序的比較子,當用Iterator 遍曆TreeMap時,得到的記錄是排過序的。
接下來是幾個的比較測試代碼:
public class TestMap { /** * 初始化一個Map * @param map */ public static void init(Map map){ if (map != null){ String key = null; for (int i=5; i>0; i--){ key = new Integer(i).toString() + ".0"; map.put(key, key.toString()); //Map中的鍵是不重複的,如果插入兩個索引值一樣的記錄, //那麼後插入的記錄會覆蓋先插入的記錄 map.put(key, key.toString() + "0"); } } } /** * 輸出一個Map * @param map */ public static void output(Map map){ if (map != null){ Object key = null; Object value = null; //使用迭代器遍曆Map的鍵,根據鍵取值 Iterator it = map.keySet().iterator(); while (it.hasNext()){ key = it.next(); value = map.get(key); System.out.println("key: " + key + "; value: " + value ); } //或者使用迭代器遍曆Map的記錄Map.Entry Map.Entry entry = null; it = map.entrySet().iterator(); while (it.hasNext()){ //一個Map.Entry代表一條記錄 entry = (Map.Entry)it.next(); //通過entry可以獲得記錄的鍵和值 //System.out.println("key: " + entry.getKey() + "; value: " + entry.getValue()); } } } /** * 判斷map是否包含某個鍵 * @param map * @param key * @return */ public static boolean containsKey(Map map, Object key){ if (map != null){ return map.containsKey(key); } return false; } /** * 判斷map是否包含某個值 * @param map * @param value * @return */ public static boolean containsValue(Map map, Object value){ if (map != null){ return map.containsValue(value); } return false; } /** * 示範HashMap */ public static void testHashMap(){ Map myMap = new HashMap(); init(myMap); //HashMap的鍵可以為null myMap.put(null,"ddd"); //HashMap的值可以為null myMap.put("aaa", null); output(myMap); } /** * 示範Hashtable */ public static void testHashtable(){ Map myMap = new Hashtable(); init(myMap); //Hashtable的鍵不能為null //myMap.put(null,"ddd"); //Hashtable的值不能為null //myMap.put("aaa", null); output(myMap); } /** * 示範LinkedHashMap */ public static void testLinkedHashMap(){ Map myMap = new LinkedHashMap(); init(myMap); //LinkedHashMap的鍵可以為null myMap.put(null,"ddd"); //LinkedHashMap的值可以為null myMap.put("aaa", null); output(myMap); } /** * 示範TreeMap */ public static void testTreeMap(){ Map myMap = new TreeMap(); init(myMap); //TreeMap的鍵不能為null //myMap.put(null,"ddd"); //TreeMap的值不能為null //myMap.put("aaa", null); output(myMap); } public static void main(String[] args) { System.out.println("採用HashMap"); TestMap.testHashMap(); System.out.println("採用Hashtable"); TestMap.testHashtable(); System.out.println("採用LinkedHashMap"); TestMap.testLinkedHashMap(); System.out.println("採用TreeMap"); TestMap.testTreeMap(); Map myMap = new HashMap(); TestMap.init(myMap); System.out.println("新初始化一個Map: myMap"); TestMap.output(myMap); //清空Map myMap.clear(); System.out.println("將myMap clear後,myMap空了麼? " + myMap.isEmpty()); TestMap.output(myMap); myMap.put("aaa", "aaaa"); myMap.put("bbb", "bbbb"); //判斷Map是否包含某鍵或者某值 System.out.println("myMap包含鍵aaa? "+ TestMap.containsKey(myMap, "aaa")); System.out.println("myMap包含值aaaa? "+ TestMap.containsValue(myMap, "aaaa")); //根據鍵刪除Map中的記錄 myMap.remove("aaa"); System.out.println("刪除鍵aaa後,myMap包含鍵aaa? "+ TestMap.containsKey(myMap, "aaa")); //擷取Map的記錄數 System.out.println("myMap包含的記錄數: " + myMap.size());
3、其他特徵
* List,Set,Map將持有對象一律視為Object型別。
* Collection、List、Set、Map都是介面,不能執行個體化。
繼承自它們的 ArrayList, Vector, HashTable, HashMap是具象class,這些才可被執行個體化。
* vector容器確切知道它所持有的對象隸屬什麼型別。vector不進行邊界檢查。
三、Collections
Collections是針對集合類的一個協助類。提供了一系列靜態方法實現對各種集合的搜尋、排序、線程完全化等操作。
相當於對Array進行類似操作的類——Arrays。
如,Collections.max(Collection coll); 取coll中最大的元素。
Collections.sort(List list); 對list中元素排序
四、如何選擇?
1、容器類和Array的區別、擇取
* 容器類僅能持有對象引用(指向對象的指標),而不是將對象資訊copy一份至數列某位置。
* 一旦將對象置入容器內,便損失了該對象的型別資訊。
2、
* 在各種Lists中,最好的做法是以ArrayList作為預設選擇。當插入、刪除頻繁時,使用LinkedList();
Vector總是比ArrayList慢,所以要盡量避免使用。
* 在各種Sets中,HashSet通常優於HashTree(插入、尋找)。只有當需要產生一個經過排序的序列,才用TreeSet。
HashTree存在的唯一理由:能夠維護其內元素的排序狀態。
* 在各種Maps中
HashMap用於快速尋找。
* 當元素個數固定,用Array,因為Array效率是最高的。
結論:最常用的是ArrayList,HashSet,HashMap,Array。而且,我們也會發現一個規律,用TreeXXX都是排序的。