文章目錄
問題的提出
上一節的例子中,每個線程互相獨立,相互之間沒有任何關係。現在假設這樣一個例子:有一個全域的計數num,每個線程擷取這個全域的計數,根據num進行一些處理,然後將num加1。很容易寫出這樣的代碼:
# encoding: UTF-8
import threading
import time
class MyThread(threading.Thread):
def run(self):
global num
time.sleep(1)
num = num+1
msg = self.name+' set num to '+str(num)
print msg
num = 0
def test():
for i in range(5):
t = MyThread()
t.start()
if __name__ == '__main__':
test()
但是運行結果是不正確的:
Thread-5 set num to 2
Thread-3 set num to 3
Thread-2 set num to 5
Thread-1 set num to 5
Thread-4 set num to 4
問題產生的原因就是沒有控制多個線程對同一資源的訪問,對資料造成破壞,使得線程啟動並執行結果不可預期。這種現象稱為“線程不安全”。
互斥鎖同步
上面的例子引出了多線程編程的最常見問題:資料共用。當多個線程都修改某一個共用資料的時候,需要進行同步控制。
線程同步能夠保證多個安全執行緒訪問競爭資源,最簡單的同步機制是引入互斥鎖。互斥鎖為資源引入一個狀態:鎖定/非鎖定。某個線程要更改共用資料時,先將其鎖定,此時資源的狀態為“鎖定”,其他線程不能更改;直到該線程釋放資源,將資源的狀態變成“非鎖定”,其他的線程才能再次鎖定該資源。互斥鎖保證了每次只有一個線程進行寫入操作,從而保證了多線程情況下資料的正確性。
threading模組中定義了Lock類,可以方便的處理鎖定:
#建立鎖
mutex = threading.Lock()
#鎖定
mutex.acquire([timeout])
#釋放
mutex.release()
其中,鎖定方法acquire可以有一個逾時時間的選擇性參數timeout。如果設定了timeout,則在逾時後通過傳回值可以判斷是否得到了鎖,從而可以進行一些其他的處理。
使用互斥鎖實現上面的例子的代碼如下:
import threading
import time
class MyThread(threading.Thread):
def run(self):
global num
time.sleep(1)
if mutex.acquire(1):
num = num+1
msg = self.name+' set num to '+str(num)
print msg
mutex.release()
num = 0
mutex = threading.Lock()
def test():
for i in range(5):
t = MyThread()
t.start()
if __name__ == '__main__':
test()
運行結果:
Thread-3 set num to 1
Thread-4 set num to 2
Thread-5 set num to 3
Thread-2 set num to 4
Thread-1 set num to 5
可以看到,加入互斥鎖後,運行結果與預期相符。
同步阻塞
當一個線程調用鎖的acquire()方法獲得鎖時,鎖就進入“locked”狀態。每次只有一個線程可以獲得鎖。如果此時另一個線程試圖獲得這個鎖,該線程就會變為“blocked”狀態,稱為“同步阻塞”(參見多線程的基本概念)。
直到擁有鎖的線程調用鎖的release()方法釋放鎖之後,鎖進入“unlocked”狀態。線程發送器從處於同步阻塞狀態的線程中選擇一個來獲得鎖,並使得該線程進入運行(running)狀態。
互斥鎖最基本的內容就是這些,下一節將討論可重新進入鎖(RLock)和死結問題。