作者:Vamei 出處:http://www.cnblogs.com/vamei 歡迎轉載,也請保留這段聲明。謝謝!
謝謝Tolbkni Kao幫我糾正錯誤
這裡的內容以Linux進程基礎和Linux文字資料流為基礎。subprocess包主要功能是執行外部的命令和程式。比如說,我需要使用wget下載檔案。我在Python中調用wget程式。從這個意義上來說,subprocess的功能與shell類似。
1. subprocess以及常用的封裝函數
當我們運行python的時候,我們都是在建立並運行一個進程。正如我們在Linux進程基礎中介紹的那樣,一個進程可以fork一個子進程,並讓這個子進程exec另外一個程式。在Python中,我們通過標準庫中的subprocess包來fork一個子進程,並運行一個外部的程式(fork,exec見Linux進程基礎)。
subprocess包中定義有數個建立子進程的函數,這些函數分別以不同的方式建立子進程,所以我們可以根據需要來從中選取一個使用。另外subprocess還提供了一些管理標準流(standard stream)和管道(pipe)的工具,從而在進程間使用文本通訊。
使用subprocess包中的函數建立子進程的時候,要注意:
1) 在建立子進程之後,父進程是否暫停,並等待子進程運行。
2) 函數返回什麼
3) 當returncode不為0時,父進程如何處理。
subprocess.call()
父進程等待子進程完成
返回退出資訊(returncode,相當於exit code,見Linux進程基礎)
subprocess.check_call()
父進程等待子進程完成
返回0
檢查退出資訊,如果returncode不為0,則舉出錯誤subprocess.CalledProcessError,該對象包含有returncode屬性,可用try...except...來檢查(見Python錯誤處理)。
subprocess.check_output()
父進程等待子進程完成
返回子進程向標準輸出的輸出結果
檢查退出資訊,如果returncode不為0,則舉出錯誤subprocess.CalledProcessError,該對象包含有returncode屬性和output屬性,output屬性為標準輸出的輸出結果,可用try...except...來檢查。
這三個函數的使用方法相類似,我們以subprocess.call()來說明:
import subprocessrc = subprocess.call(["ls","-l"])
我們將程式名(ls)和所帶的參數(-l)一起放在一個表中傳遞給subprocess.call()
可以通過一個shell來解釋一整個字串:
import subprocessout = subprocess.call("ls -l", shell=True)out = subprocess.call("cd ..", shell=True)
我們使用了shell=True這個參數。這個時候,我們使用一整個字串,而不是一個表來運行子進程。Python將先運行一個shell,再用這個shell來解釋這整個字串。
shell命令中有一些是shell的內建命令,這些命令必須通過shell運行,$cd。shell=True允許我們運行這樣一些命令。
2. Popen
實際上,我們上面的三個函數都是基於Popen()的封裝(wrapper)。這些封裝的目的在於讓我們容易使用子進程。當我們想要更個人化我們的需求的時候,就要轉向Popen類,該類產生的對象用來代表子進程。
與上面的封裝不同,Popen對象建立後,主程式不會自動等待子進程完成。我們必須調用對象的wait()方法,父進程才會等待 (也就是阻塞block):
import subprocesschild = subprocess.Popen(["ping","-c","5","www.google.com"])print("parent process")
從運行結果中看到,父進程在開啟子進程之後並沒有等待child的完成,而是直接運行print。
對比等待的情況:
import subprocesschild = subprocess.Popen(["ping","-c","5","www.google.com"])child.wait()print("parent process")
此外,你還可以在父進程中對子進程進行其它操作,比如我們上面例子中的child對象:
child.poll() # 檢查子進程狀態
child.kill() # 終止子進程
child.send_signal() # 向子進程發送訊號
child.terminate() # 終止子進程
子進程的PID儲存在child.pid
3. 子進程的文字資料流控制
(沿用child子進程) 子進程的標準輸入,標準輸出和標準錯誤也可以通過如下屬性工作表示:
child.stdin
child.stdout
child.stderr
我們可以在Popen()建立子進程的時候改變標準輸入、標準輸出和標準錯誤,並可以利用subprocess.PIPE將多個子進程的輸入和輸出串連在一起,構成管道(pipe):
import subprocesschild1 = subprocess.Popen(["ls","-l"], stdout=subprocess.PIPE)child2 = subprocess.Popen(["wc"], stdin=child1.stdout,stdout=subprocess.PIPE)
out = child2.communicate()
print(out)
subprocess.PIPE實際上為文字資料流提供一個緩衝區。child1的stdout將文本輸出到緩衝區,隨後child2的stdin從該PIPE中將文本讀取走。child2的輸出文本也被存放在PIPE中,直到communicate()方法從PIPE中讀取出PIPE中的文本。
要注意的是,communicate()是Popen對象的一個方法,該方法會阻塞父進程,直到子進程完成。
我們還可以利用communicate()方法來使用PIPE給子進程輸入:
import subprocesschild = subprocess.Popen(["cat"], stdin=subprocess.PIPE)child.communicate("vamei")
我們啟動子進程之後,cat會等待輸入,直到我們用communicate()輸入"vamei"。
通過使用subprocess包,我們可以運行外部程式。這極大的拓展了Python的功能。如果你已經瞭解了作業系統的某些應用,你可以從Python中直接調用該應用(而不是完全依賴Python),並將應用的結果輸出給Python,並讓Python繼續處理。shell的功能(比如利用文字資料流串連各個應用),就可以在Python中實現。
總結:
subprocess.call, subprocess.check_call(), subprocess.check_output()
subprocess.Popen(), subprocess.PIPE
Popen.wait(), Popen.communicate()