標籤:
Redis 監控最直接的方法當然就是使用系統提供的 info 命令來做了,你只需要執行下面一條命令,就能獲得 Redis 系統的狀態報表。
記憶體使用量
如果 Redis 使用的記憶體超出了可用的實體記憶體大小,那麼 Redis 很可能系統會被OOM Killer殺掉。針對這一點,你可以通過 info 命令對used_memory和used_memory_peak進行監控,為使用記憶體量設定閥值,並設定相應的警示機制。當然,警示只是手段,重要的是你得預先計劃好,當記憶體使用量量過大後,你應該做些什麼,是清除一些沒用的冷資料,還是把 Redis 遷移到更強大的機器上去。
持久化
如果因為你的機器或 Redis 本身的問題導致 Redis 崩潰了,那麼你唯一的救命稻草可能就是 dump 出來的 rdb檔案了,所以,對 Redis dump 檔案進行監控也是很重要的。你可以通過對rdb_last_save_time進行監控,瞭解你最近一次 dump 資料操作的時間,還可以通過對rdb_changes_since_last_save進行監控來知識如果這時候出現故障,你會丟失多少資料。
主從複製
如果你設定了主從複製模式,那麼你最好對複製的情況是否正常做一些監控,主要是對 info 輸出中的master_link_status進行監控,如果這個值是 up,那麼說明同步正常,如果是 down,那麼你就要注意一下輸出的其它一些診斷資訊了。比如下面這些:
role:slave master_host:192.168.1.128 master_port:6379 master_link_status:down master_last_io_seconds_ago:-1 master_sync_in_progress:0 master_link_down_since_seconds:1356900595 |
Fork 效能
當 Redis 持久化資料到磁碟上時,它會進行一次 fork 操作,通過 fork 對記憶體的 copy on write 機制最廉價的實現記憶體鏡像。但是雖然記憶體是 copy on write 的,但是虛擬記憶體表是在 fork 的瞬間就需要分配,所以 fork 會造成主線程短時間的卡頓(停止所有讀寫操作),這個卡頓時間和當前 Redis 的記憶體使用量量有關。通常 GB 量級的 Redis 進行 fork 操作的時間在毫秒級。你可以通過對 info 輸出的latest_fork_usec進行監控來瞭解最近一次 fork 操作導致了多少時間的卡頓。
配置一致
Redis 支援使用 CONFIG SET操作來實現運行實的配置修改,這很方便,但同時也會導致一個問題。就是通過這個命令動態修改的配置,是不會同步到你的設定檔中去的。所以當你因為某些原因重啟 Redis 時,你使用 CONFIG SET 做的配置修改就會丟失掉,所以我們最好保證在每次使用 CONFIG SET 修改配置時,也把設定檔一起相應地改掉。為了防止人為的失誤,所以我們最好對配置進行監控,使用CONFIG GET命令來擷取當前運行時的配置,並與 redis.conf 中的配置值進行對比,如果發現兩邊對不上,就啟動警示。
慢日誌
Redis 提供了SLOWLOG指令來擷取最近的慢日誌,Redis 的慢日誌是直接存在記憶體中的,所以它的慢日誌開銷並不大,在實際應用中,我們通過 crontab 任務執行 SLOWLOG 命令來擷取慢日誌,然後將慢日誌存到檔案中,並用Kibana產生即時的效能圖表來實現效能監控。
值得一提的是,Redis 的慢日誌記錄的時間,僅僅包括 Redis 自身對一條命令的執行時間,不包括 IO 的時間,比如接收用戶端資料和發送用戶端資料這些時間。另外,Redis 的慢日誌和其它資料庫的慢日誌有一點不同,其它資料庫偶爾出現 100ms 的慢日誌可能都比較正常,因為一般資料庫都是多線程並發執行,某個線程執行某個命令的效能可能並不能代表整體效能,但是對 Redis 來說,它是單線程的,一旦出現慢日誌,可能就需要馬上得到重視,最好去查一下具體是什麼原因了。
監控服務
-Sentinel
Sentinel是 Redis 內建的工具,它可以對 Redis 主從複製進行監控,並實現主掛掉之後的自動容錯移轉。在轉移的過程中,它還可以被配置去執行一個使用者自訂的指令碼,在指令碼中我們就能夠實現警示通知等功能。
-Redis Live
Redis Live是一個更通用的 Redis 監控方案,它的原理是定時在 Redis 上執行MONITOR命令,來擷取當前 Redis 當前正在執行的命令,並通過統計分析,產生web頁面的可視化分析報表。
-Redis Faina
Redis Faina是由著名的圖片分享應用 instagram 開發的 Redis 監控服務,其原理和 Redis Live 類似,都是對通過MONITOR來做的。
資料分布
弄清 Redis 中資料存放區分布是一件很難的是,比如你想知道哪類型的 key 值佔用記憶體最多。下面是一些工具,可以協助你對 Redis 的資料集進行分析。
-Redis-sampler
Redis-sampler是 Redis 作者開發的工具,它通過採用的方法,能夠讓你瞭解到當前 Redis 中的資料的大致類型,資料及分布狀況。
-Redis-audit
Redis-audit是一個指令碼,通過它,我們可以知道每一類 key 對記憶體的使用量。它可以提供的資料有:某一類 key 值的訪問頻率如何,有多少值設定了到期時間,某一類 key 值使用記憶體的大小,這很方便讓我們能排查哪些 key 不常用或者壓根不用。
-Redis-rdb-tools
Redis-rdb-tools跟 Redis-audit 功能類似,不同的是它是通過對 rdb 檔案進行分析來取得統計資料的。
Redis監控技巧總結