ssh串連linux伺服器中斷後,如何讓命令繼續在伺服器運行

來源:互聯網
上載者:User

http://blog.csdn.net/v1v1wang/article/details/6855552

 

轉自:http://www.diybl.com/course/3_program/java/javajs/20100719/455597.html

在ssh、telnet斷開之後繼續執行程式

 

你是不是經常需要 SSH 或者 telent 遠程登入到 Linux 伺服器?你是不是經常為一些長時間啟動並執行任務而頭疼,比如系統備份、ftp 傳輸等等。通常情況下我們都是為每一個這樣的任務開一個遠程終端視窗,因為他們執行的時間太長了。必須等待它執行完畢,在此期間可不能關掉視窗或者中斷連線,否則這個任務就會被殺掉,一切半途而廢了。

元兇:SIGHUP 訊號
讓我們來看看為什麼關掉視窗/中斷連線會使得正在啟動並執行程式死掉。
在Linux/Unix中,有這樣幾個概念:
進程組(process group):一個或多個進程的集合,每一個進程組有唯一一個進程組ID,即進程組長進程的ID。
會話期(session):一個或多個進程組的集合,有唯一一個會話期首進程(session leader)。會話期ID為首進程的ID。
會話期可以有一個單獨的控制終端(controlling terminal)。與控制終端串連的會話期首進程叫做控制進程(controlling process)。當前與終端互動的進程稱為前台進程組。其餘進程組稱為後台進程組。
根據POSIX.1定義:
掛斷訊號(SIGHUP)預設的動作是終止程式。
當終端介面檢測到網路連接斷開,將掛斷訊號發送給控制進程(會話期首進程)。
如果會話期首進程終止,則該訊號發送到該會話期前台進程組。
一個進程退出導致一個孤兒進程組中產生時,如果任意一個孤兒進程組進程處於STOP狀態,發送SIGHUP和SIGCONT訊號到該進程組中所有進程。
因此當網路斷開或終端視窗關閉後,控制進程收到SIGHUP訊號退出,會導致該會話期內其他進程退出。
我們來看一個例子。開啟兩個SSH終端視窗,在其中一個運行top命令。
[root@tivf09 root]# top
在另一個終端視窗,找到top的進程ID為5180,其父進程ID為5128,即登入shell。
[root@tivf09 root]# ps -ef|grep top root      5180 5128 0 01:03 pts/0    00:00:02 top root      5857 3672 0 01:12 pts/2    00:00:00 grep top
使用pstree命令可以更清楚地看到這個關係:
[root@tivf09 root]# pstree -H 5180|grep top |-sshd-+-sshd---bash---top
使用ps-xj命令可以看到,登入shell(PID 5128)和top在同一個會話期,shell為會話期首進程,所在進程組PGID為5128,top所在進程組PGID為5180,為前台進程組。
[root@tivf09 root]# ps -xj|grep 5128 5126 5128 5128 5128 pts/0     5180 S        0   0:00 -bash 5128 5180 5180 5128 pts/0     5180 S        0   0:50 top 3672 18095 18094 3672 pts/2    18094 S        0   0:00 grep 5128
關閉第一個SSH視窗,在另一個視窗中可以看到top也被殺掉了。
[root@tivf09 root]# ps -ef|grep 5128 root     18699 3672 0 04:35 pts/2    00:00:00 grep 5128
----------------------------------------------------------------------------
Unix/Linux下一般想讓某個程式在後台運行,很多都是使用 & 在程式結尾來讓程式自動運行。比如我們要運行mysql
在後台  /usr/local/mysql/bin/mysqld_safe –user=mysql &
  但是我們很多程式並不象mysqld一樣可以做成守護進程 ,可能我們的程式只是普通程式而已,一般這種程式即使使用 & 結尾,如果終端關閉,那麼程式也會被關閉。為了能夠後台運行,我們可以忽略SIGHUP訊號,關掉視窗應該就不會影響程式的運行了。nohup命令可以達到這個目的,如果程式的標準輸出/標準錯誤是終端,nohup預設將其重新導向到nohup.out檔案。值得注意的是nohup命令只是使得程式忽略SIGHUP訊號,還需要使用標記& 把它放在後台運行。我們需要使用nohup這個命令,比如我們有個start.sh需要在後台運行,並且希望在後台能夠一直運行,那麼就使用nohup:文法格式為
nohup <command> [argument...] &
如 nohup /root/start.sh   在shell中斷行符號後提示:
  [~]$ appending output to nohup.out
  原程式的的標準輸出被自動改向到目前的目錄下的nohup.out檔案,起到了log的作用。
  但是有時候在這一步會有問題,當把終端關閉後,進程會自動被關閉,察看nohup.out可以看到在關閉終端瞬間服務自動關閉。
  諮詢紅旗Linux工程師後,他也不得其解,在我的終端上執行後,他啟動的進程竟然在關閉終端後依然運行。
  在第二遍給我示範時,我才發現我和他操作終端時的一個細節不同:他是在當shell中提示了nohup成功後還需要按終端上鍵盤任意鍵退回到 shell輸入命令視窗,然後通過在shell中輸入exit來退出終端;而我是每次在nohup執行成功後直接點關閉程式按鈕關閉終端.。所以這時候會斷掉該命令所對應的session,導致nohup對應的進程被通知需要一起shutdown。
  這個細節有人和我一樣沒注意到,所以在這兒記錄一下了。
  附:nohup命令參考
  nohup 命令
  用途:不掛斷地運行命令。
文法:nohup Command [ Arg … ] [ & ]
  描述:nohup 命令運行由 Command 參數和任何相關的 Arg 參數指定的命令,忽略所有掛斷(SIGHUP)訊號。在登出後使用 nohup 命令運行後台中的程式。要運行後台中的 nohup 命令,添加 & ( 表示”and”的符號)到命令的尾部。
  無論是否將 nohup 命令的輸出重新導向到終端,輸出都將附加到目前的目錄的 nohup.out 檔案中。如果目前的目錄的 nohup.out 檔案不可寫,輸出重新導向到 $HOME/nohup.out 檔案中。如果沒有檔案能建立或開啟以用於追加,那麼 Command 參數指定的命令不可調用。如果標準錯誤是一個終端,那麼把指定的命令寫給標準錯誤的所有輸出作為標準輸出重新導向到相同的檔案描述符。
  退出狀態:該命令返回下列出口值:
  126 可以尋找但不能調用 Command 參數指定的命令。
  127 nohup 命令發生錯誤或不能尋找由 Command 參數指定的命令。
  否則,nohup 命令的退出狀態是 Command 參數指定命令的退出狀態。
  nohup命令及其輸出檔案
  nohup命令:如果你正在運行一個進程,而且你覺得在退出帳戶時該進程還不會結束,那麼可以使用nohup命令。該命令可以在你退出帳戶/關閉終端之後繼續運行相應的進程。nohup就是不掛起的意思( n ohang up)。
  該命令的一般形式為:nohup command &
  使用nohup命令提交作業
  如果使用nohup命令提交作業,那麼在預設情況下該作業的所有輸出都被重新導向到一個名為nohup.out的檔案中,除非另外指定了輸出檔案:
  nohup command > myout.file 2>&1 &
  在上面的例子中,輸出被重新導向到myout.file檔案中。
  使用 jobs 查看任務。
  使用 fg %n 關閉。
  另外有兩個常用的ftp 工具ncftpget和ncftpput,可以實現背景ftp上傳和下載,這樣就可以利用這些命令在後台上傳和下載檔案了。
----------------------------------------------------------------------------

雖然nohup很容易使用,但還是比較”簡陋”的,對於簡單的命令能夠應付過來,對於複雜的需要人機互動的任務就麻煩了。
其實我們可以使用一個更為強大的公用程式screen。流行的Linux發行版(例如Red Hat Enterprise Linux 4)通常會內建screen公用程式,如果沒有的話,可以從GNU screen的官方網站下載。
[root@tivf06 ~]# rpm -qa|grep screen xscreensaver-4.18-5.rhel4.11 screen-4.0.2-5
開始使用Screen
簡單來說,Screen是一個可以在多個進程之間多工一個物理終端的視窗管理器。Screen中有會話的概念,使用者可以在一個screen會話中建立多個screen視窗,在每一個screen視窗中就像操作一個真實的telnet/SSH串連視窗那樣。在screen中建立一個新的視窗有這樣幾種方式:
1.直接在命令列鍵入screen命令
[root@tivf06 ~]# screen
Screen將建立一個執行shell的全屏視窗。你可以執行任意shell程式,就像在ssh視窗中那樣。在該視窗中鍵入exit退出該視窗,如果這是該screen會話的唯一視窗,該screen會話退出,否則screen自動切換到前一個視窗。
2.Screen命令後跟你要執行的程式。
[root@tivf06 ~]# screen vi test.c
Screen建立一個執行vi test.c的單視窗會話,退出vi將退出該視窗/會話。
3.以上兩種方式都建立新的screen會話。我們還可以在一個已有screen會話中建立新的視窗。在當前screen視窗中鍵入C-a c ,即Ctrl鍵+a鍵,之後再按下c鍵,screen 在該會話內產生一個新的視窗並切換到該視窗。
screen還有更進階的功能。你可以不中斷screen視窗中程式的運行而暫時斷開(detach)screen會話,並在隨後時間重新串連(attach)該會話,重新控制各視窗中啟動並執行程式。例如,我們開啟一個screen視窗編輯/tmp/abc檔案:
[root@tivf06 ~]# screen vi /tmp/abc
之後我們想暫時退出做點別的事情,比如出去散散步,那麼在screen視窗鍵入C-a d (直接中斷連線也可以的),Screen會給出detached提示:
暫時中斷會話

半個小時之後回來了,找到該screen會話:
[root@tivf06 ~]# screen -ls There is a screen on:         16582.pts-1.tivf06      (Detached) 1 Socket in /tmp/screens/S-root.
重新串連會話:
[root@tivf06 ~]# screen -r 16582
看看出現什麼了,太棒了,一切都在。繼續幹吧。
你可能注意到給screen發送命令使用了特殊的鍵組合C-a。這是因為我們在鍵盤上鍵入的資訊是直接發送給當前screen視窗,必須用其他方式向screen視窗管理器發出命令,預設情況下,screen接收以C-a開始的命令。這種命令形式在screen中叫做鍵綁定(key binding),C-a叫做命令字元(command character)。
可以通過C-a ? 來查看所有的鍵綁定,常用的鍵綁定有:
C-a ? 顯示所有鍵綁定資訊
C-a w 顯示所有視窗列表
C-a C-a 切換到之前顯示的視窗
C-a c 建立一個新的運行shell的視窗並切換到該視窗
C-a n 切換到下一個視窗
C-a p 切換到前一個視窗(與C-a n相對)
C-a 0..9 切換到視窗0..9
C-a a 發送 C-a到當前視窗
C-a d 暫時斷開screen會話
C-a k 殺掉當前視窗
C-a [ 進入拷貝/復原模式
Screen常用選項
使用鍵綁定C-a ?命令可以看到, 預設的命令字元(Command key)為C-a,轉義C-a(literal ^a)的字元為a:
Screen 常用選項

因為screen把C-a看作是screen命令的開始,所以如果你想要screen視窗接收到C-a字元,就要輸入C-a a。Screen也允許你使用-e選項設定自己的命令字元和逸出字元,其格式為:
-exy x為命令字元,y為轉義命令字元的字元
下面命令啟動的screen會話指定了命令字元為C-t,轉義C-t的字元為t,通過C-t ?命令可以看到該變化。
自訂命令字元和逸出字元

[root@tivf18 root]# screen -e^tt
其他常用的命令選項有:
-c file 使用設定檔file,而不使用預設的$HOME/.screenrc
-d|-D [pid.tty.host] 不開啟新的screen會話,而是斷開其他正在啟動並執行screen會話
-h num 指定曆史復原緩衝區大小為num行
-list|-ls 列出現有screen會話,格式為pid.tty.host
-d -m 啟動一個開始就處於斷開模式的會話
-r sessionowner/ [pid.tty.host] 重新串連一個斷開的會話。多使用者模式下串連到其他使用者screen會話需要指定sessionowner,需要setuid-root許可權
-S sessionname 建立screen會話時為會話指定一個名字
-v 顯示screen版本資訊
-wipe [match] 同-list,但刪掉那些無法串連的會話
下例顯示當前有兩個處於detached狀態的screen會話,你可以使用screen -r <screen_pid>重新串連上:
[root@tivf18 root]# screen -ls There are screens on:         8736.pts-1.tivf18       (Detached)         8462.pts-0.tivf18       (Detached) 2 Sockets in /root/.screen. [root@tivf18 root]# screen -r 8736
如果由於某種原因其中一個會話死掉了(例如人為殺掉該會話),這時screen -list會顯示該會話為dead狀態。使用screen -wipe命令清除該會話:
[root@tivf18 root]# kill -9 8462 [root@tivf18 root]# screen -ls   There are screens on:         8736.pts-1.tivf18       (Detached)         8462.pts-0.tivf18       (Dead ???) Remove dead screens with 'screen -wipe'. 2 Sockets in /root/.screen. [root@tivf18 root]#
screen -wipe There are screens on:         8736.pts-1.tivf18       (Detached)         8462.pts-0.tivf18       (Removed) 1 socket wiped out. 1 Socket in /root/.screen. [root@tivf18 root]# screen -ls   There is a screen on:         8736.pts-1.tivf18       (Detached)
1 Socket in /root/.screen. [root@tivf18 root]#
-d -m 選項是一對很有意思的搭檔。他們啟動一個開始就處於斷開模式的會話。你可以在隨後需要的時候串連上該會話。有時候這是一個很有用的功能,比如我們可以使用它調試背景程式。該選項一個更常用的搭配是:-dmS sessionname
啟動一個初始狀態斷開的screen會話:
[root@tivf06 tianq]# screen -dmS mygdb gdb execlp_test
串連該會話:
[root@tivf06 tianq]# screen -r mygdb
管理你的遠端工作階段
先來看看如何使用screen解決SIGHUP問題,比如現在我們要ftp傳輸一個大檔案。如果按老的辦法,SSH登入到系統,直接ftp命令開始傳輸,之後。。如果網路速度還可以,恭喜你,不用等太長時間了;如果網路不好,老老實實等著吧,只能傳輸完畢再斷開SSH串連了。讓我們使用screen 來試試。
SSH登入到系統,在命令列鍵入screen。
[root@tivf18 root]# screen
在screen shell視窗中輸入ftp命令,登入,開始傳輸。不願意等了?OK,在視窗中鍵入C-a d:
管理你的遠端工作階段

然後。。退出SSH登入?隨你怎樣,只要別殺掉screen會話。
是不是很方便?更進一步,其實我們可以利用screen這種功能來管理你的遠端工作階段,儲存你所有的工作內容。你是不是每次登入到系統都要開很多視窗,然後每天都要重複開啟關閉這些視窗?讓screen來幫你"儲存"吧,你只需要開啟一個ssh視窗,建立需要的screen視窗,退出的時候C-a d"儲存"你的工作,下次登入後直接screen -r <screen_pid>就可以了。
最好能給每個視窗起一個名字,這樣好記些。使用C-a A給視窗起名字。使用C-a w可以看到這些視窗名字,可能名字出現的位置不同。使用putty:
putty

使用telnet:
telnet

更多Screen功能
Screen提供了豐富強大的定製功能。你可以在Screen的預設兩級設定檔/etc/screenrc和$HOME/.screenrc中指定更多,例如設定screen選項,定製綁定鍵,設定screen會話自啟動視窗,啟用多使用者模式,定製使用者存取權限控制等等。如果你願意的話,也可以自己指定screen設定檔。
以多使用者功能為例,screen預設是以單一使用者模式啟動並執行,你需要在設定檔中指定multiuser on 來開啟多使用者模式,通過acl*(acladd,acldel,aclchg...)命令,你可以靈活配置其他使用者訪問你的screen會話。更多設定檔內容請參考screen的man頁。
-------------------------------------
實際應用中碰到的問題
[root@dev ~]# screen -ls
There is a screen on:
4083.down_video (Detached)
1 Socket in /var/run/screen/S-root.
狀態顯示 down_video這個screen session已經被 斷開(detach)
此時我們用screen -r可以取回進行,
說明: -r :取回一個已被斷開的screen session
例: [root@dev ~]# screen -r down_video
可以看到我們的程式仍在運行,中間未曾停止,而且此時我們又可以控制它了。

那麼如何中斷一個 screen session?
看例子:
[root@dev ~]# screen -ls
There is a screen on:
4083.down_video (Attached)
1 Socket in /var/run/screen/S-root.
請注意: 當前看到的session : down_video 正在被串連使用中,
這時我想使用此session
[root@dev ~]# screen -r down_video
There is a screen on:
4083.down_video (Attached)
There is no screen to be resumed matching down_video.
此時用 -r 不能取到此 screen session
這時只能用 -d 參數來強制中斷它
[root@dev ~]# screen -d down_video
[4083.down_video detached.]
[root@dev ~]# screen -r down_video
再用 -r 取回 screen就成功了

注意:原來的被我們中斷的串連會顯示 :
[root@dev ~]# screen -r down_video
[remote detached]

文章出處:飛諾網(www.diybl.com):http://www.diybl.com/course/3_program/java/javajs/20100719/455597.html

 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.