標籤:百度 ESS 去重 公用服務 持久化儲存 重試 布隆過濾器 任務 top
1、為什麼使用redis
使用redis,主要是從兩個角度去考慮:效能和並發。當然,redis還具備可以做分布式鎖等其他功能,但是如果只是為了分布式鎖這些其他功能,完全還有其他中介軟體(如zookpeer等)代替,並不是非要使用redis。因此,這個問題主要從效能和並發兩個角度去答。
回答:如下所示,分為兩點
(一)效能
我們在碰到需要執行耗時特別久,且結果不頻繁變動的SQL,就特別適合將運行結果放入緩衝。這樣,後面的請求就去緩衝中讀取,使得請求能夠迅速響應。
題外話:忽然想聊一下這個迅速響應的標準。其實根據互動效果的不同,這個回應時間沒有固定標準。不過曾經有人這麼告訴我:"在理想狀態下,我們的頁面跳轉需要在瞬間解決,對於頁內操作則需要在刹那間解決。另外,超過一彈指的耗時操作要有進度提示,並且可以隨時中止或取消,這樣才能給使用者最好的體驗。
(二)並發
在大並發的情況下,所有的請求直接存取資料庫,資料庫會出現串連異常。這個時候,就需要使用redis做一個緩衝操作,讓請求先訪問到redis,而不是直接存取資料庫。
2、使用redis有什麼缺點
分析:大家用redis這麼久,這個問題是必須要瞭解的,基本上使用redis都會碰到一些問題,常見的也就幾個。
回答:主要是四個問題
(一)緩衝和資料庫雙寫一致性問題
(二)緩衝雪崩問題
(三)緩衝擊穿問題
(四)緩衝的並發競爭問題
3、單線程的redis為什麼這麼快
分析:這個問題其實是對redis內部機制的一個考察。很多人其實都不知道redis是單線程工作模型。
回答:主要是以下三點
(一)純記憶體操作
(二)單線程操作,避免了頻繁的環境切換
(三)採用了非阻塞I/O多工機制
簡單來說,就是。我們的redis-client在操作的時候,會產生具有不同事件類型的socket。在服務端,有一段I/0多工程式,將其置入隊列之中。然後,檔案事件指派器,依次去隊列中取,轉寄到不同的事件處理器中。
需要說明的是,這個I/O多工機制,redis還提供了select、epoll、evport、kqueue等多工函數庫,大家可以自行去瞭解。
4、redis的資料類型,以及每種資料類型的使用情境
回答:一共五種
(一)String
這個其實沒啥好說的,最常規的set/get操作,value可以是String也可以是數字。一般做一些複雜的計數功能的緩衝。
(二)hash
這裡value存放的是結構化的對象,比較方便的就是操作其中的某個欄位。博主在做單點登入的時候,就是用這種資料結構儲存使用者資訊,以cookieId作為key,設定30分鐘為緩衝到期時間,能很好的類比出類似session的效果。
(三)list
使用List的資料結構,可以做簡單的訊息佇列的功能。另外還有一個就是,可以利用lrange命令,做基於redis的分頁功能,效能極佳,使用者體驗好。
(四)set
因為set堆放的是一堆不重複值的集合。所以可以做全域去重的功能。為什麼不用JVM內建的Set進行去重?因為我們的系統一般都是叢集部署,使用JVM內建的Set,比較麻煩,難道為了一個做一個全域去重,再起一個公用服務,太麻煩了。
另外,就是利用交集、並集、差集等操作,可以計算共同喜好,全部的喜好,自己專屬的喜好等功能。
(五)sorted set
sorted set多了一個權重參數score,集合中的元素能夠按score進行排列。可以做熱門排行榜應用,取TOP N操作。sorted set可以用來做延時任務。最後一個應用就是可以做範圍尋找。
5、redis的到期策略以及記憶體淘汰機制
分析:這個問題其實相當重要,到底redis有沒用到家,這個問題就可以看出來。比如你redis只能存5G資料,可是你寫了10G,那會刪5G的資料。怎麼刪的,這個問題思考過嗎?還有,你的資料已經設定了到期時間,但是時間到了,記憶體佔用率還是比較高,有思考過原因麼?
回答:
redis採用的是定期刪除+惰性刪除策略。
為什麼不用定時刪除策略?
定時刪除,用一個定時器來負責監視key,到期則自動刪除。雖然記憶體及時釋放,但是十分消耗CPU資源。在大並發請求下,CPU要將時間應用在處理請求,而不是刪除key,因此沒有採用這一策略.
定期刪除+惰性刪除是如何工作的呢?
定期刪除,redis預設每個100ms檢查,是否有到期的key,有到期key則刪除。需要說明的是,redis不是每個100ms將所有的key檢查一次,而是隨機抽取進行檢查(如果每隔100ms,全部key進行檢查,redis豈不是卡死)。因此,如果只採用定期刪除策略,會導致很多key到時間沒有刪除。
於是,惰性刪除派上用場。也就是說在你擷取某個key的時候,redis會檢查一下,這個key如果設定了到期時間那麼是否到期了?如果到期了此時就會刪除。
採用定期刪除+惰性刪除就沒其他問題了麼?
不是的,如果定期刪除沒刪除key。然後你也沒即時去請求key,也就是說惰性刪除也沒生效。這樣,redis的記憶體會越來越高。那麼就應該採用記憶體淘汰機制。
在redis.conf中有一行配置
# maxmemory-policy volatile-lru
該配置就是配記憶體淘汰策略的(什麼,你沒配過?好好反省一下自己)
1)noeviction:當記憶體不足以容納新寫入資料時,新寫入操作會報錯。應該沒人用吧。
2)allkeys-lru:當記憶體不足以容納新寫入資料時,在鍵空間中,移除最近最少使用的key。推薦使用,目前項目在用這種。
3)allkeys-random:當記憶體不足以容納新寫入資料時,在鍵空間中,隨機移除某個key。應該也沒人用吧,你不刪最少使用Key,去隨機刪。
4)volatile-lru:當記憶體不足以容納新寫入資料時,在設定了到期時間的鍵空間中,移除最近最少使用的key。這種情況一般是把redis既當緩衝,又做持久化儲存的時候才用。不推薦
5)volatile-random:當記憶體不足以容納新寫入資料時,在設定了到期時間的鍵空間中,隨機移除某個key。依然不推薦
6)volatile-ttl:當記憶體不足以容納新寫入資料時,在設定了到期時間的鍵空間中,有更早到期時間的key優先移除。不推薦
ps:如果沒有設定 expire 的key, 不滿足先決條件(prerequisites); 那麼 volatile-lru, volatile-random 和 volatile-ttl 策略的行為, 和 noeviction(不刪除) 基本上一致。
6、redis和資料庫雙寫一致性問題
分析:一致性問題是分布式常見問題,還可以再分為最終一致性和強一致性。資料庫和緩衝雙寫,就必然會存在不一致的問題。答這個問題,先明白一個前提。就是如果對資料有強一致性要求,不能放緩衝。我們所做的一切,只能保證最終一致性。另外,我們所做的方案其實從根本上來說,只能說降低不一致發生的機率,無法完全避免。因此,有強一致性要求的資料,不能放緩衝。
首先,採取正確更新策略,先更新資料庫,再刪緩衝。其次,因為可能存在刪除緩衝失敗的問題,提供一個補償措施即可,例如利用訊息佇列。
7、如何應對緩衝穿透和緩衝雪崩問題
分析:這兩個問題,說句實在話,一般中小型傳統軟體企業,很難碰到這個問題。如果有大並發的項目,流量有幾百萬左右。這兩個問題一定要深刻考慮。
回答:如下所示
緩衝穿透,即駭客故意去請求緩衝中不存在的資料,導致所有的請求都懟到資料庫上,從而資料庫連接異常。
解決方案:
(一)利用互斥鎖,緩衝失效的時候,先去獲得鎖,得到鎖了,再去請求資料庫。沒得到鎖,則休眠一段時間重試
(二)採用非同步更新策略,無論key是否取到值,都直接返回。value值中維護一個緩衝失效時間,緩衝如果到期,非同步起一個線程去讀資料庫,更新緩衝。需要做緩衝預熱(項目啟動前,先載入緩衝)操作。
(三)提供一個能迅速判斷請求是否有效攔截機制,比如,利用布隆過濾器,內部維護一系列合法有效key。迅速判斷出,請求所攜帶的Key是否合法有效。如果不合法,則直接返回。
緩衝雪崩,即緩衝同一時間大面積的失效,這個時候又來了一波請求,結果請求都懟到資料庫上,從而導致資料庫連接異常。
解決方案:
(一)給緩衝的失效時間,加上一個隨機值,避免集體失效。
(二)使用互斥鎖,但是該方案輸送量明顯下降了。
(三)雙緩衝。我們有兩個緩衝,緩衝A和緩衝B。緩衝A的失效時間為20分鐘,緩衝B不設失效時間。自己做緩衝預熱操作。然後細分以下幾個小點
- I 從緩衝A讀資料庫,有則直接返回
- II A沒有資料,直接從B讀資料,直接返回,並且非同步啟動一個更新線程。
- III 更新線程同時更新緩衝A和緩衝B。
8、如何解決redis的並發競爭key問題
分析:這個問題大致就是,同時有多個子系統去set一個key。這個時候要注意什麼呢?大家思考過麼。需要說明一下,博主提前百度了一下,發現答案基本都是推薦用redis事務機制。博主不推薦使用redis的事務機制。因為我們的生產環境,基本都是redis叢集環境,做了資料分區操作。你一個事務中有涉及到多個key操作的時候,這多個key不一定都儲存在同一個redis-server上。因此,redis的事務機制,十分雞肋。
回答:如下所示
(1)如果對這個key操作,不要求順序
這種情況下,準備一個分布式鎖,大家去搶鎖,搶到鎖就做set操作即可,比較簡單。
(2)如果對這個key操作,要求順序
假設有一個key1,系統A需要將key1設定為valueA,系統B需要將key1設定為valueB,系統C需要將key1設定為valueC.
期望按照key1的value值按照 valueA-->valueB-->valueC的順序變化。這種時候我們在資料寫入資料庫的時候,需要儲存一個時間戳記。假設時間戳記如下
系統A key 1 {valueA 3:00}系統B key 1 {valueB 3:05}系統C key 1 {valueC 3:10}
那麼,假設這會系統B先搶到鎖,將key1設定為{valueB 3:05}。接下來系統A搶到鎖,發現自己的valueA的時間戳記早於緩衝中的時間戳記,那就不做set操作了。以此類推。
redis 的相關知識點