互連網_大資料

來源:互聯網
上載者:User

標籤:style   使用   strong   資料   ar   演算法   sp   on   

1,給定兩個整數集合A和B,每個集合都包含20億個不同整數,請給出快速計算A∩B的演算法,演算法可使用外存,但是要求佔用記憶體不能超過4GB。

答:

基本思路:利用bitmap以及位元運算來實現。

思考過程:整數最大為2的32次方-1;如果每位依次記錄一個數,那麼需要int的個數是(2的32次方-1)/32=1億個。佔用的記憶體大小為4byte*1億=0.4G。不超過題目要求的4G.

因此,解決思路是:

1)申請兩個[2的32次方-1]/32個int型的整數數組

2)依次掃描兩個集合A和B,如果集合包含某一個整數,就將對應位置1

3)之後將兩個用作標誌位的兩個整形數組做交運算

思考,如果是兩個集合中都包含20億個url呢,如何求出二者的交集(利用bloom過濾器)轉換為一個尋找操作?<具體實現?>

 

 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.