redis五種資料類型的使用 (摘自:http://tech.it168.com/a2011/0818/1234/000001234478_all.shtml )
1、String
常用命令:
set,get,decr,incr,mget 等。
應用情境:
String是最常用的一種資料類型,普通的key/value儲存都可以歸為此類,這裡就不所做解釋了。
實現方式:
String在redis內部儲存預設就是一個字串,被redisObject所引用,當遇到incr,decr等操作時會轉成數值型進行計算,此時redisObject的encoding欄位為int。
2、Hash
常用命令:
hget,hset,hgetall 等。
應用情境:
我們簡單舉個執行個體來描述下Hash的應用情境,比如我們要儲存一個使用者資訊對象資料,包含以下資訊:
使用者ID,為尋找的key,
儲存的value使用者物件包含姓名name,年齡age,生日birthday 等資訊,
如果用普通的key/value結構來儲存,主要有以下2種儲存方式:
第一種方式將使用者ID作為尋找key,把其他資訊封裝成一個對象以序列化的方式儲存,
如:set u001 "李三,18,20010101"
這種方式的缺點是,增加了序列化/還原序列化的開銷,並且在需要修改其中一項資訊時,需要把整個對象取回,並且修改操作需要對並發進行保護,引入CAS等複雜問題。
第二種方法是這個使用者資訊對象有多少成員就存成多少個key-value對兒,用使用者ID+對應屬性的名稱作為唯一標識來取得對應屬性的值,
如:mset user:001:name "李三 "user:001:age18user:001:birthday "20010101"
雖然省去了序列化開銷和並發問題,但是使用者ID為重複儲存,如果存在大量這樣的資料,記憶體浪費還是非常可觀的。
那麼Redis提供的Hash很好的解決了這個問題,Redis的Hash實際是內部儲存的Value為一個HashMap,並提供了直接存取這個Map成員的介面,
如:hmset user:001 name "李三" age 18 birthday "20010101"
也就是說,Key仍然是使用者ID, value是一個Map,這個Map的key是成員的屬性名稱,value是屬性值,這樣對資料的修改和存取都可以直接通過其內部Map的Key(Redis裡稱內部Map的key為field), 也就是通過 key(使用者ID) + field(屬性標籤) 就可以操作對應屬性資料了,既不需要重複儲存資料,也不會帶來序列化和並發修改控制的問題。很好的解決了問題。
這裡同時需要注意,Redis提供了介面(hgetall)可以直接取到全部的屬性資料,但是如果內部Map的成員很多,那麼涉及到遍曆整個內部Map的操作,由於Redis單執行緒模式的緣故,這個遍曆操作可能會比較耗時,而另其它用戶端的請求完全不響應,這點需要格外注意。
實現方式:
上面已經說到Redis Hash對應Value內部實際就是一個HashMap,實際這裡會有2種不同實現,這個Hash的成員比較少時Redis為了節省記憶體會採用類似一維數組的方式來緊湊儲存,而不會採用真正的HashMap結構,對應的value redisObject的encoding為zipmap,當成員數量增大時會自動轉成真正的HashMap,此時encoding為ht。
3、List
常用命令:
lpush,rpush,lpop,rpop,lrange等。
應用情境:
Redis list的應用情境非常多,也是Redis最重要的資料結構之一,比如twitter的關注列表,粉絲列表等都可以用Redis的list結構來實現,比較好理解,這裡不再重複。
實現方式:
Redis list的實現為一個雙向鏈表,即可以支援反向尋找和遍曆,更方便操作,不過帶來了部分額外的記憶體開銷,Redis內部的很多實現,包括髮送緩衝隊列等也都是用的這個資料結構。
4、Set
常用命令:
sadd,spop,smembers,sunion 等。
應用情境:
Redis set對外提供的功能與list類似是一個列表的功能,特殊之處在於set是可以自動排重的,當你需要儲存一個列表資料,又不希望出現重複資料時,set是一個很好的選擇,並且set提供了判斷某個成員是否在一個set集合內的重要介面,這個也是list所不能提供的。
實現方式:
set 的內部實現是一個 value永遠為null的HashMap,實際就是通過計算hash的方式來快速排重的,這也是set能提供判斷一個成員是否在集合內的原因。
5、Sorted set
常用命令:
zadd,zrange,zrem,zcard等
使用情境:
Redis sorted set的使用情境與set類似,區別是set不是自動有序的,而sorted set可以通過使用者額外提供一個優先順序(score)的參數來為成員排序,並且是插入有序的,即自動排序。當你需要一個有序的並且不重複的集合列表,那麼可以選擇sorted set資料結構,比如twitter 的public timeline可以以發表時間作為score來儲存,這樣擷取時就是自動按時間排好序的。
實現方式:
Redis sorted set的內部使用HashMap和跳躍表(SkipList)來保證資料的儲存和有序,HashMap裡放的是成員到score的映射,而跳躍表裡存放的是所有的成員,排序依據是HashMap裡存的score,使用跳躍表的結構可以獲得比較高的尋找效率,並且在實現上比較簡單