[文章作者:張宴 本文版本:v1.0 最後修改:2008.11.19 轉載請註明原文連結:http://blog.s135.com/post/379/]
在生產應用中,某台“Nginx+PHP+MySQL”介面資料服務器,扮演的角色十分重要,如果伺服器硬體或Nginx、MySQL發生故障,而短時 間內無法恢複,後果將非常嚴重。為了避免單點故障,我設計了此套方案,編寫了failover.sh指令碼,實現了雙機互備、全自動切換,容錯移轉時間只需 幾十秒。
一、雙機互備、全自動切換方案:
1、拓撲圖:
2、解釋:
(1)、假設外網網域名稱blog.s135.com解析到外網虛擬IP 72.249.146.214上,內網hosts設定db10對應內網虛擬IP 192.168.146.214
(2)、預設情況下,由主機綁定內、外網虛擬IP,備機作為備份,當主機的MySQL、Nginx或伺服器出現故障無法訪問時,備機會自動接管內、外網 虛擬IP。兩台伺服器都啟動負責監控、自動切換虛擬IP的守護進程/usr/bin/nohup /bin/sh /usr/local/webserver/failover/failover.sh 2>&1 > /dev/null &
(3)、主機和備機上的MySQL伺服器互為主從,互相同步。在主機處於活動狀態(即由主機綁定虛擬IP)時,讀寫主機的 MySQL,寫到主機的資料會同步到備機;在備機處於活動狀態時,讀寫備機的MySQL,寫到備機的資料會同步到主機(如果主機上的MySQL死掉暫時無 法同步,主機上的MySQL恢複後,資料會自動從備機上同步過來,反之亦然)。
(4)、主機處於活動狀態時,每20秒會把 /data0/htdocs/(網頁、程式、圖片存放目錄)、/usr/local/webserver/PHP/etc/(PHP.ini等設定檔目 錄)、/usr/local/webserver/nginx/conf/(Nginx設定檔目錄)三個目錄下的檔案通過rsync推送到備機伺服器上 的對應目錄(增量推送,兩台伺服器上一樣的檔案不會重複推送),反之如果備機處於活動狀態時,每20秒會嘗試把檔案推送到主機。rsync的設定檔見兩 台伺服器的/etc/rsyncd.conf,rsync守護進程的啟動命令為rsync --daemon
3、自動切換流程
(1)、主機預設綁定內、外網虛擬IP,當主機的MySQL、Nginx無法訪問或伺服器宕機,主機上的failover.sh守護進程會自動摘除自己 綁定的內、外網虛擬IP(如果主機上的failover.sh死掉,無法摘除自己綁定的虛擬IP也沒關係),備機上的failover.sh守護進程會自 動接管備機原來綁定的內、外網虛擬IP,並發送ARPing包給內、外網網關更新MAC,強行接管。
(2)、備機綁定虛擬IP後,會發送ARPing包給內、外網網關,通知網關更新虛擬IP的MAC地址為備機的MAC地址,從而保證了切換後能夠通過虛擬IP及時訪問到備機。
(3)、如果主機的MySQL、Nginx啟動起來,全部恢複正常訪問,主機上的failover.sh守護進程會檢測主機上的MySQL資料是否已經 完全從備機上同步過來。如果同步延遲時間為0,主機會自動接管內、外網虛擬IP,並發送ARPing包給內、外網網關,而備機也會自動摘除內、外網虛擬 IP。
(4)、整個切換流程均由failover.sh自動完成,無需人工處理。
4、注意事項(很重要):
(1)、crontab裡的檔案沒有做自動同步,如果修改,需要手工在兩台伺服器上都做修改。
(2)、/data0/htdocs/目錄內任何用ln -s建立的軟串連,rsync不會自動同步,如果在一台伺服器上建了軟串連,需要手工在另外一台伺服器上也建相同的軟串連。
(3)、如果要刪除/data0/htdocs/目錄內的某些檔案或目錄,需要先刪除處於活動狀態(即綁定了虛擬IP)伺服器上的檔案或目錄,再刪除處於備用狀態伺服器上的檔案或目錄。
(4)、除了/data0/htdocs/(網頁、程式、圖片存放目錄)、/usr/local/webserver/PHP/etc /(PHP.ini等設定檔目錄)、/usr/local/webserver/nginx/conf/(Nginx設定檔目錄)三個目錄之外的其他 配置修改,需要在兩台伺服器上都做修改。
二、配置文檔與指令碼:
1、主機、備機兩台伺服器的rsync配置(配置相同)
(1)、rsync設定檔
vi /etc/rsyncd.conf
輸入一些內容並儲存:
引用uid = root
gid = root
use chroot = no
max connections = 20
pid file = /var/run/rsyncd.pid
lock file = /var/run/rsync.lock
log file = /var/log/rsyncd.log
[data0_htdocs]
path = /data0/htdocs/
ignore errors
read only = no
hosts allow = 192.168.146.0/24
hosts deny = 0.0.0.0/32
[PHP_etc]
path = /usr/local/webserver/PHP/etc/
ignore errors
read only = no
hosts allow = 192.168.146.0/24
hosts deny = 0.0.0.0/32
[nginx_conf]
path = /usr/local/webserver/nginx/conf/
ignore errors
read only = no
hosts allow = 192.168.146.0/24
hosts deny = 0.0.0.0/32
(2)、啟動rsync守護進程
/usr/bin/rsync --daemon
2、兩台MySQL互為主從的配置
這裡就不詳細寫出互為主從的配置過程了,如果不懂的朋友可以在Google上搜一下。有一點需要指出,my.cnf設定檔中請加上skip-name-resolve參數,使用IP來進行MySQL帳號驗證。
3、主機、備機兩台伺服器負載監控、虛擬IP自動切換的failover.sh守護進程
(1)、啟動failover.sh守護進程(為了開機能夠自動運行,請將以下語句添加到/etc/rc.local檔案中):
/usr/bin/nohup /bin/sh /usr/local/webserver/failover/failover.sh 2>&1 > /dev/null &
(2)、停止failover.sh守護進程:
ps -ef | grep failover.sh
會顯示以下資訊:
root 15428 1 0 Nov17 ? 00:00:03 /bin/sh /usr/local/webserver/failover/failover.sh
root 20123 6878 0 16:16 pts/2 00:00:00 grep failover.sh
然後殺死failover.sh的進程:
kill -9 15428
(3)、failover.sh代碼內容(請注意其中的type設定,主機設為master,備機設為slave):
#!/bin/sh
LANG=C
date=$(date -d "today" +"%Y-%m-%d %H:%M:%S")
#---------------配置資訊(開始)---------------
#類型:主機設為master,備機設為slave
type="master"
#主機、備機切換日誌路徑
logfile="/var/log/failover.log"
#MySQL可執行檔地址,例如/usr/local/mysql/bin/mysql;MySQL使用者名稱;密碼;連接埠
mysql_bin="/usr/local/webserver/mysql/bin/mysql"
mysql_username="root"
mysql_password="123456"
mysql_port="3306"
#內網網關
gateway_eth0="192.168.146.1"
#主機內網真實IP
rip_eth0_master="192.168.146.213"
#備機內網真實IP
rip_eth0_slave="192.168.146.215"
#主機、備機內網共用的虛擬IP
vip_eth0_share="192.168.113.214"
#外網網關
gateway_eth1="72.249.146.193"
#主機外網真實IP
rip_eth1_master="72.249.146.213"
#備機外網真實IP
rip_eth1_slave="72.249.146.215"
#主機、備機外網共用的虛擬IP
vip_eth1_share="72.249.146.214"
#---------------配置資訊(結束)---------------
#綁定內、外網虛擬IP
function_bind_vip()
{
/sbin/ifconfig eth0:vip $ broadcast $ netmask 255.255.255.255 up
/sbin/route add -host $ dev eth0:vip
/sbin/ifconfig eth1:vip $ broadcast $ netmask 255.255.255.255 up
/sbin/route add -host $ dev eth1:vip
/usr/local/webserver/PHP/sbin/PHP-fpm reload
kill -USR1 `cat /usr/local/webserver/nginx/logs/nginx.pid`
/sbin/service crond start
}
#解除內、外網虛擬IP
function_remove_vip()
{
/sbin/ifconfig eth0:vip $ broadcast $ netmask 255.255.255.255 down
/sbin/ifconfig eth1:vip $ broadcast $ netmask 255.255.255.255 down
/sbin/service crond stop
}
#主機向備機推送檔案的函數
function_rsync_master_to_slave()
{
/usr/bin/rsync -zrtuog /data0/htdocs/ $::data0_htdocs/ > /dev/null 2>&1
/usr/bin/rsync -zrtuog /usr/local/webserver/PHP/etc/ $::PHP_etc/ > /dev/null 2>&1
/usr/bin/rsync -zrtuog /usr/local/webserver/nginx/conf/ $::nginx_conf/ > /dev/null 2>&1
}
#備機向主機推送檔案的函數
function_rsync_slave_to_master()
{
/usr/bin/rsync -zrtuog /data0/htdocs/ $::data0_htdocs/ > /dev/null 2>&1
/usr/bin/rsync -zrtuog /usr/local/webserver/PHP/etc/ $::PHP_etc/ > /dev/null 2>&1
/usr/bin/rsync -zrtuog /usr/local/webserver/nginx/conf/ $::nginx_conf/ > /dev/null 2>&1
}
#虛擬IP ARPing
function_vip_arping()
{
/sbin/arping -I eth0 -c 3 -s $ $ > /dev/null 2>&1
/sbin/arping -I eth1 -c 3 -s $ $ > /dev/null 2>&1
}
while true
do
#用HTTP協議檢查虛擬IP
if (curl -m 30 -G http://$/ > /dev/null 2>&1) && ($ -u"$" -p"$" -P"$" -h"$" -e"show slave status\G" > /dev/null 2>&1)
then
#取得與內網VIP綁定的伺服器內網IP
eth0_active_server=$($ -u"$" -p"$" -P"$" -h"$" -e"show slave status\G" | grep "Master_Host" | awk -F ': ' '{printf $2}')
#如果內網VIP=主機內網IP(主機MySQL中的Master_Host顯示的是備機的網域名稱或IP),且本機為主機
if [ "$" = "$" ] && [ "$" = "master" ]
then
function_rsync_master_to_slave
function_vip_arping
#如果內網VIP=備機內網IP(備機MySQL中的Master_Host顯示的是主機的網域名稱或IP)
elif [ "$" = "$" ]
then
if (curl -m 30 -G http://$/ > /dev/null 2>&1) && ($ -u"$" -p"$" -P"$" -h"$" -e"show slave status\G" | grep "Seconds_Behind_Master: 0" > /dev/null 2>&1)
then
#如果主機能夠訪問,資料庫同步無延遲,且本機就是主機,那麼由本機綁定虛擬IP
if [ "$" = "master" ]
then
#如果本機為主機
function_bind_vip
function_vip_arping
echo "$ 主機已綁定虛擬IP!(Type:1)" >> $
else
#如果本機為備機
function_remove_vip
echo "$ 備機已去除虛擬IP!(Type:2)" >> $
fi
else
if [ "$" = "slave" ]
then
#如果本機為備機
function_rsync_slave_to_master
function_vip_arping
fi
fi
fi
else
#虛擬IP無法訪問時,判斷主機能否訪問
if (curl -m 30 -G http://$/ > /dev/null 2>&1) && ($ -u"$" -p"$" -P"$" -h"$" -e"show slave status\G" > /dev/null 2>&1)
then
#如果主機能夠訪問,且本機就是主機,那麼由本機綁定虛擬IP
if [ "$" = "master" ]
then
function_bind_vip
function_vip_arping
echo "$ 主機已綁定虛擬IP!(Type:3)" >> $
else
function_remove_vip
echo "$ 備機已去除虛擬IP!(Type:4)" >> $
fi
elif (curl -m 30 -G http://$/ > /dev/null 2>&1) && ($ -u"$" -p"$" -P"$" -h"$" -e"show slave status\G" > /dev/null 2>&1)
then
#如果主機不能訪問而備機能夠訪問,且本機就是備機,那麼由備機綁定虛擬IP
if [ "$" = "slave" ]
then
function_bind_vip
function_vip_arping
echo "$ 備機已綁定虛擬IP!(Type:5)" >> $
else
function_remove_vip
echo "$ 主機已去除虛擬IP!(Type:6)" >> $
fi
else
echo "$ 主機、備機全部無法訪問!(Type:7)" >> $
fi
fi
#每次迴圈暫停20秒(即間隔20秒檢測一次)
sleep 20
done