在Python的gevent架構下執行非同步Solr查詢的教程

來源:互聯網
上載者:User
我經常需要用Python與solr進行非同步請求工作。這裡有段代碼阻塞在Solr http請求上, 直到第一個完成才會執行第二個請求,代碼如下:

import requests #Search 1solrResp = requests.get('http://mysolr.com/solr/statedecoded/search?q=law') for doc in solrResp.json()['response']['docs']:  print doc['catch_line'] #Search 2solrResp = requests.get('http://mysolr.com/solr/statedecoded/search?q=shoplifting') for doc in solrResp.json()['response']['docs']:  print doc['catch_line']

(我們用Requests庫進行http請求)

通過指令碼把文檔索引到Solr, 進而可以並行工作是很好的。我需要擴充我的工作,因此索引瓶頸是Solr,而不是網路請求。


不幸的是,當進行非同步編程時python不像Javascript或Go那樣方便。但是,gevent庫能給我們帶來些協助。gevent底層用的是libevent庫,構建於原生非同步呼叫(select, poll等原始非同步呼叫),libevent很好的協調很多低層的非同步功能。

使用gevent很簡單,讓人糾結的一點就是thegevent.monkey.patch_all(), 為更好的與gevent的非同步協作,它修補了很多標準庫。聽起來很恐怖,但是我還沒有在使用這個補丁實現時遇到 問題。


事不宜遲,下面就是你如果用gevents來並行Solr請求:

import requestsfrom gevent import monkeyimport geventmonkey.patch_all()  class Searcher(object):  """ Simple wrapper for doing a search and collecting the    results """  def __init__(self, searchUrl):    self.searchUrl = searchUrl   def search(self):    solrResp = requests.get(self.searchUrl)    self.docs = solrResp.json()['response']['docs']  def searchMultiple(urls):  """ Use gevent to execute the passed in urls;    dump the results"""  searchers = [Searcher(url) for url in urls]   # Gather a handle for each task  handles = []  for searcher in searchers:    handles.append(gevent.spawn(searcher.search))   # Block until all work is done  gevent.joinall(handles)   # Dump the results  for searcher in searchers:    print "Search Results for %s" % searcher.searchUrl    for doc in searcher.docs:      print doc['catch_line'] searchUrls = ['http://mysolr.com/solr/statedecoded/search?q=law',       'http://mysolr.com/solr/statedecoded/search?q=shoplifting']


searchMultiple(searchUrls)
代碼增加了,而且不如相同功能的Javascript代碼簡潔,但是它能完成相應的工作,代碼的精髓是下面幾行:

# Gather a handle for each taskhandles = []for searcher in searchers:  handles.append(gevent.spawn(searcher.search)) # Block until all work is donegevent.joinall(handles)

我們讓gevent產生searcher.search, 我們可以對產生的任務進行操作,然後我們可以隨意的等著所有產生的任務完成,最後匯出結果。

差不多就這樣子.如果你有任何想法請給我們留言。讓我們知道我們如何能為你的Solr搜尋應用提供協助。

  • 相關文章

    聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.