標籤:blog http java 使用 os io strong 檔案
ehcache memcache redis 三大緩衝男高音2013-01-16 15:43 10500人閱讀 評論(2) 收藏 舉報
最近項目組有用到這三個緩衝,去各自的官方看了下,覺得還真的各有千秋!今天特意歸納下各個緩衝的優缺點,僅供參考!
Ehcache
在java項目廣泛的使用。它是一個開源的、設計於提高在資料從RDBMS中取出來的高花費、高延遲採取的一種緩衝方案。正因為Ehcache具有健壯性(基於java開發)、被認證(具有apache 2.0 license)、充滿特色(稍後會詳細介紹),所以被用於大型複雜分布式web application的各個節點中。
什麼特色?
1. 夠快
Ehcache的發行有一段時間長度了,經過幾年的努力和不計其數的效能測試,Ehcache終被設計於large, high concurrency systems.
2. 夠簡單
開發人員提供的介面非常簡單明了,從Ehcache的搭建到運用運行僅僅需要的是你寶貴的幾分鐘。其實很多開發人員都不知道自己用在用Ehcache,Ehcache被廣泛的運用於其他的開源項目
比如:hibernate
3.夠袖珍
關於這點的特性,官方給了一個很可愛的名字small foot print ,一般Ehcache的發布版本不會到2M,V 2.2.3 才 668KB。
4. 夠輕量
核心程式僅僅依賴slf4j這一個包,沒有之一!
5.好擴充
Ehcache提供了對大資料的記憶體和硬碟的儲存,最近版本允許多執行個體、儲存對象高靈活性、提供LRU、LFU、FIFO淘汰演算法,基礎屬性支援熱配置、支援的外掛程式多
6.監聽器
緩衝管理器監聽器 (CacheManagerListener)和 緩衝監聽器(CacheEvenListener),做一些統計或資料一致性廣播挺好用的
如何使用?
夠簡單就是Ehcache的一大特色,自然用起來just so easy!
貼一段基本使用代碼
CacheManager manager = CacheManager.newInstance("src/config/ehcache.xml");Ehcache cache = new Cache("testCache", 5000, false, false, 5, 2);cacheManager.addCache(cache);
代碼中有個ehcache.xml檔案,現在來介紹一下這個檔案中的一些屬性
- name:緩衝名稱。
- maxElementsInMemory:緩衝最大個數。
- eternal:對象是否永久有效,一但設定了,timeout將不起作用。
- timeToIdleSeconds:設定對象在失效前的允許閑置時間(單位:秒)。僅當eternal=false對象不是永久有效時使用,可選屬性,預設值是0,也就是可閑置時間無窮大。
- timeToLiveSeconds:設定對象在失效前允許存活時間,最大時間介於建立時間和失效時間之間。僅當eternal=false對象不是永久有效時使用,預設是0.,也就是對象存活時 間無窮大。
- overflowToDisk:當記憶體中對象數量達到maxElementsInMemory時,Ehcache將會對象寫到磁碟中。
- diskSpoolBufferSizeMB:這個參數設定DiskStore(磁碟緩衝)的緩衝區大小。預設是30MB。每個Cache都應該有自己的一個緩衝區。
- maxElementsOnDisk:硬碟最大緩衝個數。
- diskPersistent:是否緩衝虛擬機器重啟期資料 Whether the disk store persists between restarts of the Virtual Machine. The default value is false.
- diskExpiryThreadIntervalSeconds:磁碟失效線程已耗用時間間隔,預設是120秒。
- memoryStoreEvictionPolicy:當達到maxElementsInMemory限制時,Ehcache將會根據指定的策略去清理記憶體。預設策略是LRU。你可以設定為 FIFO或是LFU。
- clearOnFlush:記憶體數量最大時是否清除。
memcache
memcache 是一種高效能、分布式對象緩衝系統,最初設計於緩解動態網站資料庫載入資料的延遲性,你可以把它想象成一個大的記憶體HashTable,就是一個key-value索引值緩衝。Danga Interactive為了LiveJournal所發展的,以BSD license釋放的一套開放原始碼軟體。
1.依賴
memcache C語言所編寫,依賴於最近版本的GCC和libevent。GCC是它的編譯器,同事基於libevent做socket io。在安裝memcache時保證你的系統同事具備有這兩個環境。
2.多線程支援
memcache支援多個cpu同時工作,在memcache安裝檔案下有個叫threads.txt中特別說明,By default, memcached is compiled as a single-threaded application.預設是單線程編譯安裝,如果你需要多線程則需要修改./configure --enable-threads,為了支援多核系統,前提是你的系統必須具有多線程工作模式。開啟多線程工作的線程數預設是4,如果線程數超過cpu數容易發生操作死結的機率。結合自己業務模式選擇才能做到物盡其用。
3.高效能
通過libevent完成socket 的通訊,理論上效能的瓶頸落在網卡上。
簡單安裝:
1.分別把memcached和libevent下載回來,放到 /tmp 目錄下:
# cd /tmp
# wget http://www.danga.com/memcached/dist/memcached-1.2.0.tar.gz
# wget http://www.monkey.org/~provos/libevent-1.2.tar.gz
2.先安裝libevent:
# tar zxvf libevent-1.2.tar.gz
# cd libevent-1.2
# ./configure -prefix=/usr
# make (如果遇到提示gcc 沒有安裝則先安裝gcc)
# make install
3.測試libevent是否安裝成功:
# ls -al /usr/lib | grep libevent
lrwxrwxrwx 1 root root 21 11?? 12 17:38 libevent-1.2.so.1 -> libevent-1.2.so.1.0.3
-rwxr-xr-x 1 root root 263546 11?? 12 17:38 libevent-1.2.so.1.0.3
-rw-r-r- 1 root root 454156 11?? 12 17:38 libevent.a
-rwxr-xr-x 1 root root 811 11?? 12 17:38 libevent.la
lrwxrwxrwx 1 root root 21 11?? 12 17:38 libevent.so -> libevent-1.2.so.1.0.3
還不錯,都安裝上了。
4.安裝memcached,同時需要安裝中指定libevent的安裝位置:
# cd /tmp
# tar zxvf memcached-1.2.0.tar.gz
# cd memcached-1.2.0
# ./configure -with-libevent=/usr
# make
# make install
如果中間出現報錯,請仔細檢查錯誤資訊,按照錯誤資訊來配置或者增加相應的庫或者路徑。
安裝完成後會把memcached放到 /usr/local/bin/memcached ,
5.測試是否成功安裝memcached:
# ls -al /usr/local/bin/mem*
-rwxr-xr-x 1 root root 137986 11?? 12 17:39 /usr/local/bin/memcached
-rwxr-xr-x 1 root root 140179 11?? 12 17:39 /usr/local/bin/memcached-debug
啟動memcache服務
啟動Memcached服務:
1.啟動Memcache的伺服器端:
# /usr/local/bin/memcached -d -m 8096 -u root -l 192.168.77.105 -p 12000 -c 256 -P /tmp/memcached.pid
-d選項是啟動一個守護進程,
-m是分配給Memcache使用的記憶體數量,單位是MB,我這裡是8096MB,
-u是運行Memcache的使用者,我這裡是root,
-l是監聽的伺服器IP地址,如果有多個地址的話,我這裡指定了伺服器的IP地址192.168.77.105,
-p是設定Memcache監聽的連接埠,我這裡設定了12000,最好是1024以上的連接埠,
-c選項是最大啟動並執行並發串連數,預設是1024,我這裡設定了256,按照你伺服器的負載量來設定,
-P是設定儲存Memcache的pid檔案,我這裡是儲存在 /tmp/memcached.pid,
2.如果要結束Memcache進程,執行:
# cat /tmp/memcached.pid 或者 ps -aux | grep memcache (找到對應的進程id號)
# kill 進程id號
也可以啟動多個守護進程,不過連接埠不能重複。
memcache 的串連
telnet ip port
注意串連之前需要再memcache服務端把memcache的防火牆規則加上
-A RH-Firewall-1-INPUT -m state --state NEW -m tcp -p tcp --dport 3306 -j ACCEPT
重新載入防火牆規則
service iptables restart
OK ,現在應該就可以連上memcache了
在用戶端輸入stats 查看memcache的狀態資訊
pid memcache伺服器的進程ID
uptime 伺服器已經啟動並執行秒數
time 伺服器當前的unix時間戳記
version memcache版本
pointer_size 當前作業系統的指標大小(32位系統一般是32bit)
rusage_user 進程的累計使用者時間
rusage_system 進程的累計系統時間
curr_items 伺服器當前儲存的items數量
total_items 從伺服器啟動以後儲存的items總數量
bytes 當前伺服器儲存items佔用的位元組數
curr_connections 當前開啟著的串連數
total_connections 從伺服器啟動以後曾經開啟過的串連數
connection_structures 伺服器分配的串連構造數
cmd_get get命令 (擷取)總請求次數
cmd_set set命令 (儲存)總請求次數
get_hits 總叫用次數
get_misses 總未叫用次數
evictions 為擷取空閑記憶體而刪除的items數(分配給memcache的空間用滿後需要刪除舊的items來得到空間分配給新的items)
bytes_read 讀取位元組數(請求位元組數)
bytes_written 總發送位元組數(結果位元組數)
limit_maxbytes 分配給memcache的記憶體大小(位元組)
threads 當前線程數
redis
redis是在memcache之後編寫的,大家經常把這兩者做比較,如果說它是個key-value store 的話但是它具有豐富的資料類型,我想暫時把它叫做快取資料流中心,就像現在物流中心那樣,order、package、store、classification、distribute、end。現在還很流行的LAMP PHP架構 不知道和 redis+mysql 或者 redis + mongodb的效能比較(聽群裡的人說mongodb分區不穩定)。
先說說reidis的特性
1. 支援持久化
redis的本地持久化支援兩種方式:RDB和AOF。RDB 在redis.conf設定檔裡配置持久化觸發器,AOF指的是redis沒增加一條記錄都會儲存到持久化檔案中(儲存的是這條記錄的產生命令),如果不是用redis做DB用的話還會不要開AOF ,資料太龐大了,重啟恢複的時候是一個巨大的工程!
2.豐富的資料類型
redis 支援 String 、Lists、sets、sorted sets、hashes 多種資料類型,新浪微博會使用redis做nosql主要也是它具有這些類型,時間排序、職能排序、我的微博、發給我的這些功能List 和 sorted set
的強大操作功能息息相關
3.高效能
這點跟memcache很想象,記憶體操作的層級是毫秒級的比硬碟操作秒級操作自然高效不少,較少了磁頭尋道、資料讀取、頁面交換這些高開銷的操作!這也是NOSQL冒出來的原因吧,應該是高效能
是基於RDBMS的衍生產品,雖然RDBMS也具有緩衝結構,但是始終在app層面不是我們想要的那麼操控的。
4.replication
redis提供主從複製方案,跟mysql一樣差異複寫而且複製的實現都很相似,這個複製跟AOF有點類似複製的是新增記錄命令,主庫新增記錄將新增指令碼發送給從庫,從庫根據指令碼產生記錄,這個過程非常快,就看網路了,一般主從都是在同一個區域網路,所以可以說redis的主從近似及時同步,同事它還支援一主多從,動態添加從庫,從庫數量沒有限制。 主從庫搭建,我覺得還是採用網狀模式,如果使用鏈式(master-slave-slave-slave-slave·····)如果第一個slave出現宕機重啟,首先從master 接收 資料恢複指令碼,這個是阻塞的,如果主庫資料幾TB的情況恢複過程得花上一段時間,在這個過程中其他的slave就無法和主庫同步了。
5.更新快
這點好像從我接觸到redis到目前為止 已經發了大版本就4個,小版本沒算過。redis作者是個非常積極的人,無論是郵件提問還是論壇發帖,他都能及時耐心的為你解答,維護度很高。有人維護的話,讓我們用的也省心和放心。目前作者對redis 的主導開發方向是redis的叢集方向。
redis的安裝
redis的安裝其實還是挺簡單的,總的來說就三步:下載tar包,解壓tar包,安裝。
不過最近我在2.6.7後用centos 5.5 32bit 時碰到一個安裝問題,下面我就用圖片分享下安裝過程碰到的問題,在redis 檔案夾內執行make時有個如下的錯 undefined reference to ‘__sync_add_and_fetch_4‘
上網找了了好多最後在 https://github.com/antirez/redis/issues/736 找到解決方案,write CFLAGS= -march=i686 on src/Makefile head!
記得要把剛安裝失敗的檔案刪除,重新解壓新的安裝檔案,修改Makefile檔案,再make安裝。就不會發現原來那個錯誤了
關於redis的一些屬性注釋和基本類型操作在上一篇redis 的開胃菜有詳細的說明,這裡就不再重複累贅了(實質是想偷懶 ,哈哈!)
最後,把memcache和redis放在一起不得不會讓人想到兩者的比較,誰快誰好用啊,群裡面已經為這個事打架很久了,我就把我看到的在這裡跟大家分享下。
在別人發了一個memcache效能比redis好很多後,redis 作者 antirez 發表了一篇博文,主要是說到如何給redis 和 memcache 做壓力測試,文中講到有個人說許多開源軟體都應該丟進廁所,因為他們的壓力測試指令碼太2了,作者對這個說明了一番。redis vs memcache is definitely an apple to apple comparison。 呵呵,很明確吧,兩者的比較是不是有點雞蛋挑骨頭的效果,作者在相同的運行環境做了三次測試取多好的值,得到的結果如:
需要申明的是此次測試在單核心處理的過程的資料,memcache是支援多核心多線程操作的(預設沒開)所以在預設情況下具有參考意義,若然則memcache快於redis。那為什麼redis不支援多線程多核心處理呢?作者也發表了一下自己的看法,首先是多線程不變於bug的修複,其實是不易軟體的擴充,還有資料一致性問題因為redis所有的操作都是原子操作,作者用到一個詞nightmare 噩夢,呵呵! 當然不支援多線程操作,肯定也有他的弊端的比如效能想必必然差,作者從2.2版本後專註redis cluster的方向開發來緩解其效能上的弊端,說白了就是縱向不行,橫向提高。