關於HBase刪除多行的討論

來源:互聯網
上載者:User

有時候會有這樣的需求,需要刪除指定某些行的資料。但是筆者看《HBase權威指南》好像沒有Delete的filter(過濾器),所以想了一下如果實現刪除指定行的方法

  1. 如果知道要刪除某些行的行鍵,那麼很簡單,用List<Delete>就可以完成這個功能
  2. 如果要刪除的行在表中是連續的,也就是刪除指定範圍的行,但是你還不知道這個範圍內所有的行鍵,比如一個表中行鍵11-19的行,但是表中只有11,13,16。這時可以採用的方法是用Scan先讀出範圍內的行鍵,用Scan方法就可以使用Filter,其中有一個Filter是KeyOnlyFilter,因為我們只需要Key
    Scan sc = new Scan();Filter fil = new KeyOnlyFilter();sc.setStartRow(startRow);sc.setStopRow(stopRow);

  3. 上面提到了Filter,所以我們可以通過用Scan和Filter來讀取指定Key然後再Delete
    Scan scan=new Scan();Filter filter=new RowFilter(CompareFilter.CompareOp.EQUAL,new RegexStringComparator(pyramidName));scan.setFilter(filter);ResultScanner resultScanner=tileTable.getScanner(scan);List<Delete> deletes=new ArrayList<Delete>();for(Result result:resultScanner){byte[] row=result.getRow();Delete deleteTile=new Delete(row);deletes.add(deleteTile);}tileTable.delete(deletes);

PS:第三種方法會在叢集中傳送很多無用的資料,無形中增加了網路的頻寬。但是這也是沒有辦法的事情。以上代碼都沒經過測試,大體是這個意思

PSS:如果誰有更好的方法,希望能和我說一聲

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.