Python環境下安裝使用非同步任務隊列包Celery的基礎教程

來源:互聯網
上載者:User
1.簡介

celery(芹菜)是一個非同步任務隊列/基於分布式訊息傳遞的作業隊列。它側重於即時操作,但對調度支援也很好。
celery用於生產系統每天處理數以百萬計的任務。
celery是用Python編寫的,但該協議可以在任何語言實現。它也可以與其他語言通過webhooks實現。
建議的訊息代理RabbitMQ的,但提供有限支援Redis, Beanstalk, MongoDB, CouchDB, ,和資料庫(使用SQLAlchemy的或Django的 ORM) 。
celery是易於整合Django, Pylons and Flask,使用 django-celery, celery-pylons and Flask-Celery 附加元件封裝即可。

2. 安裝
有了上面的概念,需要安裝這麼幾個東西:RabbitMQ、SQLAlchemy、Celery
安裝方式也都很簡單: RabbitMQ:
mac下:

brew install rabbitmq

linux:

sudo apt-get install rabbitmq-server

剩下兩個都是Python的東西了,直接pip安裝就好了,對於從來沒有安裝過MySQL驅動的同學可能需要安裝MySQL-python。
安裝完成之後,啟動服務:

$ rabbitmq-server[斷行符號]

啟動後不要關閉視窗, 下面操作建立視窗(Tab)

3. 簡單案例
確保你之前的RabbitMQ已經啟動。
還是官網的那個例子,在任意目錄建立一個tasks.py的檔案,內容如下:

from celery import Celeryapp = Celery('tasks', broker='amqp://guest@localhost//')@app.taskdef add(x, y):  return x + y

在同級目錄執行:

$ celery -A tasks worker --loglevel=info

該命令的意思是啟動一個worker,把tasks中的任務(add(x,y))把任務放到隊列中。
保持視窗開啟,新開一個視窗進入互動模式,python或者ipython:

>>> from tasks import add>>> add.delay(4, 4)

到此為止,你已經可以使用celery執行任務了,上面的python互動模式下簡單的調用了add任務,並傳遞4,4參數。
但此時有一個問題,你突然想知道這個任務的執行結果和狀態,到底完了沒有。因此就需要設定backend了。
修改之前的tasks.py中的代碼為:

# coding:utf-8import subprocessfrom time import sleepfrom celery import Celerybackend = 'db+mysql://root:@192.168.0.102/celery'broker = 'amqp://guest@192.168.0.102:5672'app = Celery('tasks', backend=backend, broker=broker)@app.taskdef add(x, y):  sleep(10)  return x + y@app.taskdef hostname():  return subprocess.check_output(['hostname'])

除了添加backend之外,上面還添加了一個who的方法用來測試多伺服器操作。修改完成之後,還是按照之前的方式啟動。
同樣進入python的互動模型:

>>> from tasks import add, hostname>>> r = add.delay(4, 4)>>> r.ready() # 10s內執行,會輸出False,因為add中sleep了10s>>>>>> r = hostname.delay()>>> r.result # 輸出你的hostname

4. 測試多伺服器
做完上面的測試之後,產生了一個疑惑,Celery叫做分布式任務管理,那它的分布式體現在哪?它的任務都是怎麼執行的?在哪個機器上執行的?
在當前伺服器上的celery服務不關閉的情況下,按照同樣的方式在另外一台伺服器上安裝Celery,並啟動:

$ celery -A tasks worker --loglevel=info

發現前一個伺服器的Celery服務中輸出你剛啟動的伺服器的hostname,前提是那台伺服器連上了你的rabbitmq。
然後再進入python互動模式:

>>> from tasks import hostname>>>>>> for i in range(10):...   r = hostname.delay()...   print r.result # 輸出你的hostname>>>

看你輸入的內容已經觀察兩台伺服器上你啟動celery服務的輸出。

5. RabbitMQ遠端連線的問題
一開始測試時遠程伺服器無法串連本地的RabbitMQ服務,後來發現需要設定許可權,在/usr/local/etc/rabbitmq/rabbitmq-env.conf這個檔案中,修改NODE_IP_ADDRESS=127.0.0.1中的ip為0.0.0.0。

6. 總結的說
這篇文章簡單的介紹了Celery的使用,重點還是在分布式的使用。覺得不太爽的地方是,在擴充時,需要重新把代碼(tasks.py)部署一遍,而不是可以直接把tasks進行共用,可能Celery是通過task來進行不同的worker的匹配的?目前還不太瞭解,等深入使用之後再說。

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.