有時候會有這樣的需求,需要刪除指定某些行的資料。但是筆者看《HBase權威指南》好像沒有Delete的filter(過濾器),所以想了一下如果實現刪除指定行的方法
- 如果知道要刪除某些行的行鍵,那麼很簡單,用List<Delete>就可以完成這個功能
- 如果要刪除的行在表中是連續的,也就是刪除指定範圍的行,但是你還不知道這個範圍內所有的行鍵,比如一個表中行鍵11-19的行,但是表中只有11,13,16。這時可以採用的方法是用Scan先讀出範圍內的行鍵,用Scan方法就可以使用Filter,其中有一個Filter是KeyOnlyFilter,因為我們只需要Key
Scan sc = new Scan();Filter fil = new KeyOnlyFilter();sc.setStartRow(startRow);sc.setStopRow(stopRow);
- 上面提到了Filter,所以我們可以通過用Scan和Filter來讀取指定Key然後再Delete
Scan scan=new Scan();Filter filter=new RowFilter(CompareFilter.CompareOp.EQUAL,new RegexStringComparator(pyramidName));scan.setFilter(filter);ResultScanner resultScanner=tileTable.getScanner(scan);List<Delete> deletes=new ArrayList<Delete>();for(Result result:resultScanner){byte[] row=result.getRow();Delete deleteTile=new Delete(row);deletes.add(deleteTile);}tileTable.delete(deletes);
PS:第三種方法會在叢集中傳送很多無用的資料,無形中增加了網路的頻寬。但是這也是沒有辦法的事情。以上代碼都沒經過測試,大體是這個意思
PSS:如果誰有更好的方法,希望能和我說一聲