前言
在業務開發過程中,經常會在後台寫一些shell指令碼處理資料,但估計很多人不知道shell指令碼也可以支援多線程,而且非常簡單。本篇文章主要就是介紹shell實現多進程以及進程數量控制。
需求
為了更好的說明問題,我們結合例子講解,假設需求就是掃描url.txt檔案,然後判斷裡面的URL是否失效。url.txt檔案的內容是一行一個URL,如:
複製代碼 代碼如下:
http://www.baidu.com
http://www.google.com
http://www.jb51.net
單進程實現
那麼shell指令碼scanUrl.sh可以這樣寫:
複製代碼 代碼如下:
#!/bin/bash
#判斷是否有參數
if [ $# != 1 ] ;then
echo "The parameters you enter is not correct !";
exit -1;
fi
#迴圈讀出URL並判斷狀態代碼
while read line
do
{
isok=`curl -I -o /dev/null -s -w %{http_code} $line`
if [ "$isok" = "200" ]; then
echo $line "OK"
else
echo $line "no"
fi
}
done < $1
echo "執行結束"
那麼可以執行下面的命令掃描:
複製代碼 代碼如下:
/bin/sh scanUrl.sh url.txt
但這樣指令碼執行非常慢,一萬個URL幾個小時都掃描不完。
多進程實現
改成多進程實現非常簡單,只需要在do後面的大括弧加 & 符號,在done後面加一個wait,表示父進程等待子進程退出後再退出
複製代碼 代碼如下:
#!/bin/bash
#判斷是否有參數
if [ $# != 1 ] ;then
echo "The parameters you enter is not correct !";
exit -1;
fi
#迴圈讀出URL並判斷狀態代碼
while read line
do
{
isok=`curl -I -o /dev/null -s -w %{http_code} $line`
if [ "$isok" = "200" ]; then
echo $line "OK"
else
echo $line "no"
fi
}
}&
done < $1
wait
echo "執行結束"
這樣就能多進程並發執行了,但有個問題是進程會一下子非常多,幾百上千,超過系統限制報錯,下面我們就加上進程數控制。
多進程實現並控制進程數
複製代碼 代碼如下:
#!/bin/bash
#允許的進程數
THREAD_NUM=200
#定義描述符為9的管道
mkfifo tmp
exec 9<>tmp
#預先寫入指定數量的分行符號,一個分行符號代表一個進程
for ((i=0;i<$THREAD_NUM;i++))
do
echo -ne "\n" 1>&9
done
if [ $# != 1 ] ;then
echo "The parameters you enter is not correct !";
exit -1;
fi
while read line
do
{
#進程式控制制
read -u 9
{
#isok=`curl -I -o /dev/null -s -w %{http_code} $line`
if [ "$isok" = "200" ]; then
echo $line "OK"
else
echo $line "no"
fi
echo -ne "\n" 1>&9
}&
}
done < $1
wait
echo "執行結束"
rm tmp
上面的代碼就可以保證子進程在指定數量了,其進程式控制制原理是通過管道實現的,當管道無內容可讀時就不會執行
複製代碼 代碼如下:
{
#isok=`curl -I -o /dev/null -s -w %{http_code} $line`
if [ "$isok" = "200" ]; then
echo $line "OK"
else
echo $line "no"
fi
#寫入一個分行符號
echo -ne "\n" 1>&9
}&
而且每個進程執行完成後都會向管道寫入一個分行符號,從而保證進程數是指定的。
這樣就能達到我們的目的了。