背景
我們公司在用inotify+rsync做即時同步,來解決分布式叢集檔案一致性的問題。但當web檔案越來越多(百萬級數量html,jpg等小 檔案),同步就越來越慢,根本做不到即時,按照網上的調優方法都嘗試過,問題根本沒有解決。經過我一翻細緻研究,終於把慢的核心問題研究明白,先總結一句 inotifywait響應不會有延遲,rsync也很快。大家同樣有慢的煩惱,那是因為網上的inotify+rsync的教程都是坑。下面我們來分 析。
inotifywait 單獨分析
/usr/local/bin/inotifywait -mrq --format '%Xe %w%f' -e modify,create,delete,attrib /data/
執行上面命令,是讓inotifywait監聽/data/目錄,當監聽到有發生modify,create,delete,attrib等事件發生時,按%Xe %w%f的格式輸出。
在/data/目錄touch幾個檔案
touch /data/{1..5}
觀看inotify輸出
ATTRIB /data/1 -- 表示發生了ATTRIB事件 路徑為/data/1
ATTRIB /data/2
ATTRIB /data/3
ATTRIB /data/4
ATTRIB /data/5
知道上面的輸出效果之後 我們應該想得到,可以用rsync擷取inotifywait監控到的檔案清單來做指定的檔案同步,而不是每次都由rsync做全目錄掃描來判斷檔案是否存在差異。
網上的inotify+rsync分析
我們來看網上的教程,我加了注釋。(網上所有的教程基本都一模一樣,儘管寫法不一樣,致命點都是一樣的)
#!/bin/bash
/usr/bin/inotifywait -mrq --format '%w%f'-e create,close_write,delete /backup |while read file
#把發生更改的檔案清單都接收到file 然後迴圈,但有什麼鬼用呢?下面的命令都沒有引用這個$file 下面做的是全量rsync
do
cd /backup && rsync -az --delete /backup/ rsync_backup@192.168.24.101::backup/--password-file=/etc/rsync.password
done
#注意看 這裡的rsync 每次都是全量的同步(這就坑爹了),而且 file列表是迴圈形式觸發rsync ,等於有10個檔案發生更改,就觸發10次rsync全量同步(簡直就是噩夢),那還不如直接寫個死迴圈的rsync全量同步得了。
#有很多人會說 日誌輸出那裡明明只有差異檔案的同步記錄。其實這是rsync的功能,他本來就只會輸出有差異需要同步的檔案資訊。不信你直接拿這句rsync來跑試試。
#這種在需要同步的來源目錄檔案量很大的情況下,簡直是不堪重負。不僅耗CPU還耗時,根本不可以做到即時同步。
備忘:backup為rsync server配置module,除了編寫指令碼以外,還需要配置一個rsync server,rsync server配置參考《http://www.ttlsa.com/linux/rsync-install-on-linux/》
改良方法
要做到即時,就必須要減少rsync對目錄的遞迴掃描判斷,儘可能的做到只同步inotify監控到已發生更改的檔案。結合rsync的特性,所以這裡要分開判斷來實現一個目錄的增刪改查對應的操作。
指令碼如下
#!/bin/bash
src=/data/ # 需要同步的源路徑
des=data # 目標伺服器上 rsync --daemon 發布的名稱,rsync --daemon這裡就不做介紹了,網上搜一下,比較簡單。
rsync_passwd_file=/etc/rsyncd.passwd # rsync驗證的密碼檔案
ip1=192.168.0.18 # 目標伺服器1
ip2=192.168.0.19 # 目標伺服器2
user=root # rsync --daemon定義的驗證使用者名稱
cd ${src} # 此方法中,由於rsync同步的特性,這裡必須要先cd到來源目錄,inotify再監聽 ./ 才能rsync同步後目錄結構一致,有興趣的同學可以進行各種嘗試觀看其效果
/usr/local/bin/inotifywait -mrq --format '%Xe %w%f' -e modify,create,delete,attrib,close_write,move ./ | while read file # 把監控到有發生更改的"檔案路徑列表"迴圈
do
INO_EVENT=$(echo $file | awk '{print $1}') # 把inotify輸出切割 把事件類型部分賦值給INO_EVENT
INO_FILE=$(echo $file | awk '{print $2}') # 把inotify輸出切割 把檔案路徑部分賦值給INO_FILE
echo "-------------------------------$(date)------------------------------------"
echo $file
#增加、修改、寫入完成、移動進事件
#增、改放在同一個判斷,因為他們都肯定是針對檔案的操作,即使是建立目錄,要同步的也只是一個空目錄,不會影響速度。
if [[ $INO_EVENT =~ 'CREATE' ]] || [[ $INO_EVENT =~ 'MODIFY' ]] || [[ $INO_EVENT =~ 'CLOSE_WRITE' ]] || [[ $INO_EVENT =~ 'MOVED_TO' ]] # 判斷事件類型
then
echo 'CREATE or MODIFY or CLOSE_WRITE or MOVED_TO'
rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip1}::${des} && # INO_FILE變數代表路徑哦 -c校正檔案內容
rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip2}::${des}
#仔細看 上面的rsync同步命令 源是用了$(dirname ${INO_FILE})變數 即每次只針對性的同步發生改變的檔案的目錄(只同步目標檔案的方法在生產環境的某些極端環境下會漏檔案 現在可以在不漏檔案下也有不錯的速度 做到平衡) 然後用-R參數把源的目錄結構遞迴到目標後面 保證目錄結構一致性
fi
#刪除、移動出事件
if [[ $INO_EVENT =~ 'DELETE' ]] || [[ $INO_EVENT =~ 'MOVED_FROM' ]]
then
echo 'DELETE or MOVED_FROM'
rsync -avzR --delete --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip1}::${des} &&
rsync -avzR --delete --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip2}::${des}
#看rsync命令 如果直接同步處理已刪除的路徑${INO_FILE}會報no such or directory錯誤 所以這裡同步的源是被刪檔案或目錄的上一級路徑,並加上--delete來刪除目標上有而源中沒有的檔案,這裡不能做到指定檔案刪除,如果刪除的路徑越靠近根,則同步的目錄月多,同步刪除的操作就越花時間。這裡有更好方法的同學,歡迎交流。
fi
#修改屬性事件 指 touch chgrp chmod chown等操作
if [[ $INO_EVENT =~ 'ATTRIB' ]]
then
echo 'ATTRIB'
if [ ! -d "$INO_FILE" ] # 如果修改屬性的是目錄 則不同步,因為同步目錄會發生遞迴掃描,等此目錄下的檔案發生同步時,rsync會順帶更新此目錄。
then
rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip1}::${des} &&
rsync -avzcR --password-file=${rsync_passwd_file} $(dirname ${INO_FILE}) ${user}@${ip2}::${des}
fi
fi
done
每兩小時做1次全量同步
因為inotify只在啟動時會監控目錄,他沒有啟動期間的檔案發生更改,他是不知道的,所以這裡每2個小時做1次全量同步,防止各種意外遺漏,保證目錄一致。
crontab -e
* */2 * * * rsync -avz --password-file=/etc/rsync-client.pass /data/ root@192.168.0.18::data && rsync -avz --password-file=/etc/rsync-client.pass /data/ root@192.168.0.19::data
改良後我們公司這種百萬級小檔案也能做到實施同步了。
下面附上inotify的參數說明
inotify介紹-- 是一種強大的、細顆粒的、非同步檔案系統監控機制,*&####&*_0_*&####&*核心從2.6.13起,加入Inotify可以監控檔案系統中添加、刪除、修改移動等各種事件,利用這個核心介面,就可以監控檔案系統下檔案的各種變化情況。
inotifywait 參數說明
參數名稱 |
參數說明 |
-m,–monitor |
始終保持事件監聽狀態 |
-r,–recursive |
遞迴查詢目錄 |
-q,–quiet |
只列印監控事件的資訊 |
–excludei |
排除檔案或目錄時,不區分大小寫 |
-t,–timeout |
逾時時間 |
–timefmt |
指定時間輸出格式 |
–format |
指定時間輸出格式 |
-e,–event |
後面指定刪、增、改等事件 |
inotifywait events事件說明
事件名稱 |
事件說明 |
access |
讀取檔案或目錄內容 |
modify |
修改檔案或目錄內容 |
attrib |
檔案或目錄的屬性改變 |
close_write |
修改真實檔案內容 |
close_nowrite |
close |
open |
檔案或目錄被開啟 |
moved_to |
檔案或目錄移動到 |
moved_from |
檔案或目錄從移動 |
move |
移動檔案或目錄移動到監視目錄 |
create |
在監視目錄下建立檔案或目錄 |
delete |
刪除監視目錄下的檔案或目錄 |
delete_self |
unmount |
卸載檔案系統 |
最佳化 Inotify
# 在/proc/sys/fs/inotify目錄下有三個檔案,對inotify機制有一定的限制
[root@web ~]# ll /proc/sys/fs/inotify/
總用量0
-rw-r--r--1 root root 09月923:36 max_queued_events
-rw-r--r--1 root root 09月923:36 max_user_instances
-rw-r--r--1 root root 09月923:36 max_user_watches
-----------------------------
max_user_watches #設定inotifywait或inotifywatch命令可以監視的檔案數量(單進程)
max_user_instances #設定每個使用者可以啟動並執行inotifywait或inotifywatch命令的進程數
max_queued_events #設定inotify執行個體事件(event)隊列可容納的事件數目量
----------------------------
[root@web ~]# echo 50000000>/proc/sys/fs/inotify/max_user_watches -- 把他加入/etc/rc.local就可以實現每次重啟都生效
[root@web ~]# echo 50000000>/proc/sys/fs/inotify/max_queued_events