理解生產者消費者模型及在Python編程中的運用執行個體,生產者python

來源:互聯網
上載者:User

理解生產者消費者模型及在Python編程中的運用執行個體,生產者python

什麼是生產者消費者模型

在 工作中,大家可能會碰到這樣一種情況:某個模組負責產生資料,這些資料由另一個模組來負責處理(此處的模組是廣義的,可以是類、函數、線程、進程等)。產 生資料的模組,就形象地稱為生產者;而處理資料的模組,就稱為消費者。在生產者與消費者之間在加個緩衝區,我們形象的稱之為倉庫,生產者負責往倉庫了進商 品,而消費者負責從倉庫裡拿商品,這就構成了生產者消費者模型。結構圖如下:

生產者消費者模型的優點:

1、解耦

假設生產者和消費者分別是兩個類。如果讓生產者直接調用消費者的某個方法,那麼生產者對於消費者就會產生依賴(也就是耦合)。將來如果消費者的代碼發生變化, 可能會影響到生產者。而如果兩者都依賴於某個緩衝區,兩者之間不直接依賴,耦合也就相應降低了。

舉個例子,我們去郵局投遞信件,如果不使用郵筒(也就是緩衝區),你必須得把信直接交給郵遞員。有同學會說,直接給郵遞員不是挺簡單的嘛?其實不簡單,你必須 得認識誰是郵遞員,才能把信給他(光憑身上穿的制服,萬一有人假冒,就慘了)。這就產生和你和郵遞員之間的依賴(相當於生產者和消費者的強耦合)。萬一哪天郵遞員換人了,你還要重新認識一下(相當於消費者變化導致修改生產者代碼)。而郵筒相對來說比較固定,你依賴它的成本就比較低(相當於和緩衝區之間的弱耦合)。

2、支援並發

由於生產者與消費者是兩個獨立的並發體,他們之間是用緩衝區作為橋樑串連,生產者只需要往緩衝區裡丟資料,就可以繼續生產下一個資料,而消費者只需要從緩衝區了拿資料即可,這樣就不會因為彼此的處理速度而發生阻塞。

接上面的例子,如果我們不使用郵筒,我們就得在郵局等郵遞員,直到他回來,我們把信件交給他,這期間我們啥事兒都不能幹(也就是生產者阻塞),或者郵遞員得挨家挨戶問,誰要寄信(相當於消費者輪詢)。

3、支援忙閑不均

緩衝區還有另一個好處。如果製造資料的速度時快時慢,緩衝區的好處就體現出來了。當資料製造快的時候,消費者來不及處理,未處理的資料可以暫時存在緩衝區中。 等生產者的製造速度慢下來,消費者再慢慢處理掉。

為了充分複用,我們再拿寄信的例子來說事。假設郵遞員一次只能帶走1000封信。萬一某次碰上情人節(也可能是聖誕節)送賀卡,需要寄出去的信超過1000封,這時 候郵筒這個緩衝區就派上用場了。郵遞員把來不及帶走的信暫存在郵筒中,等下次過來 時再拿走。

Python樣本:
利用隊列實現簡單的生產者消費者模型,生產者產生時間放入隊列,消費者取出時間列印

class Consumer(threading.Thread):  def __init__(self, queue):    threading.Thread.__init__(self)    self._queue = queue  def run(self):    while True:      msg = self._queue.get()      if isinstance(msg, str) and msg == 'quit':        break      print "I'm a thread, and I received %s!!" % msg    print 'Bye byes!'def producer():  queue = Queue.Queue()  worker = Consumer(queue)  worker.start() # 開啟消費者線程  start_time = time.time()  while time.time() - start_time < 5:    queue.put('something at %s' % time.time())    time.sleep(1)  queue.put('quit')  worker.join()if __name__ == '__main__':  producer()

   
使用多線程,在做爬蟲的時候,生產者用著產生url連結,消費者用於擷取url資料,在隊列的協助下可以使用多線程加快爬蟲速度。

import timeimport threadingimport Queueimport urllib2class Consumer(threading.Thread):  def __init__(self, queue):    threading.Thread.__init__(self)    self._queue = queue  def run(self):    while True:      content = self._queue.get()      print content      if isinstance(content, str) and content == 'quit':        break      response = urllib2.urlopen(content)    print 'Bye byes!'def Producer():  urls = [    'http://211.103.242.133:8080/Disease/Details.aspx?id=2258',    'http://211.103.242.133:8080/Disease/Details.aspx?id=2258',    'http://211.103.242.133:8080/Disease/Details.aspx?id=2258',    'http://211.103.242.133:8080/Disease/Details.aspx?id=2258'  ]  queue = Queue.Queue()  worker_threads = build_worker_pool(queue, 4)  start_time = time.time()  for url in urls:    queue.put(url)  for worker in worker_threads:    queue.put('quit')  for worker in worker_threads:    worker.join()  print 'Done! Time taken: {}'.format(time.time() - start_time)def build_worker_pool(queue, size):  workers = []  for _ in range(size):    worker = Consumer(queue)    worker.start()    workers.append(worker)  return workersif __name__ == '__main__':  Producer()

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.