redis 和 bloom filter

來源:互聯網
上載者:User

標籤:

今天打算使用redis 的bitset搞一個 bloom filter, 這樣的好處是可以節省記憶體,壞處是可能在會有一些資料因為提示重複而無法儲存。

bloom filter 的大體原理就是通過不同的hash函數將一個字串映射到幾個不同的位,並將這幾個不同的位設定為1.

如果在尋找某個字串的時候,發現通過hash映射後的位有的不為1,說明該字串不存在。

如果發現所有的位都為1,那該字串有一定的機率不存在,通常這個機率會很小。

 

相關內容可以查看:

http://olylakers.iteye.com/blog/2089275

不過上面的是java的,我在github上找了一個python的

http://github.com/jaybaird/python-bloomfilter/

不過這個是基於python的bitarray 的,稍微修改了下,並刪掉了許多東西,讓它變成使用redis的bitset

https://github.com/walkwalkwalk/python_redis_bloomfilter

 

redis 和 bloom filter

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.