shell 命令列中操作HBase資料庫執行個體詳解_Linux

來源:互聯網
上載者:User

 shell 命令列中操作HBase資料庫

Shell控制

進入到shell命令列介面,執行hbase命令,並附加shell關鍵字: 

[grid@hdnode3 ~]$ hbase shell HBase Shell; enter ¨help¨ for list of supported commands. Type "exit" to leave the HBase Shell Version 0.90.5, r1212209, Fri Dec 9 05:40:36 UTC 2011  hbase(main):001:0> 

 雖然成功登入進去了,可是我們也不知道現在能做什麼,也不瞭解SHELL下都有哪些命令。這個時候,我們可以選擇,去看官方文檔中的說明,或者,敲個help上去看看。

  hbase(main):002:0> help .................. .................. COMMAND GROUPS:  Group name: general  Commands: status, version   Group name: ddl  Commands: alter, create, describe, disable, drop, enable, exists, is_disabled, is_enabled, list   Group name: dml  Commands: count, delete, deleteall, get, get_counter, incr, put, scan, truncate   Group name: tools  Commands: assign, balance_switch, balancer, close_region, compact, flush, major_compact, move, split, unassign, zk_dump   Group name: replication  Commands: add_peer, disable_peer, enable_peer, remove_peer, start_replication, stop_replication .................. ..................

 協助資訊果然有協助,通過輸出的資訊,我們大致瞭解能夠做什麼。可以看到hbase中也是分有ddl/dml這類語句,此外還有與複製相關的,與管理相關的命令等等。 

先來試試通用(general)命令,查詢狀態:

 hbase(main):003:0> status 5 servers, 0 dead, 0.4000 average load

查詢版本:

  hbase(main):004:0> version 0.90.5, r1212209, Fri Dec 9 05:40:36 UTC 2011

接下來重點項,DDL和DML(想不到HBase也分了DML/DDL語句)。HBase中沒有庫的概念,做為BigTable的山寨產品,儘管沒名山寨到名字,但山寨到了精髓,從設計上來說,它也不需要分庫,甚至不需要分表,所有資料放到同一張表中也是可以的,這就是真正的BigTable嘛。 

建立表對象:

  hbase(main):005:0> create ¨t¨,¨t_id¨,¨t_vl¨ 0 row(s) in 2.3490 seconds

 HBase中建立對象的文法比較靈活,前面這個樣本是簡寫法,其功能等效於完整寫法,"hbase> create ¨t¨, {NAME => ¨t_id¨}, {NAME => ¨t_vl¨}",第一個參數用於指定表名,後面跟的所有參數都是列族的名稱。每個表的列族需要在表建立時定義好(儘管後期也可以修改,但最好一開始就定義好),從這個角度來看,HBase中的對象是結構化的。

 查看錶對象:

  hbase(main):006:0> list TABLE                                                                                   t                                                                                     1 row(s) in 0.0080 seconds hbase(main):018:0> describe ¨t¨ DESCRIPTION                                                 ENABLED                           {NAME => ¨t¨, FAMILIES => [{NAME => ¨t_id¨, BLOOMFILTER => ¨NONE¨, REPLICATION_SCOPE => ¨0¨, COMPRESSION => true                              ¨NONE¨, VERSIONS => ¨3¨, TTL => ¨2147483647¨, BLOCKSIZE => ¨65536¨, IN_MEMORY => ¨false¨, BLOCKCACHE => ¨t                               rue¨}, {NAME => ¨t_vl¨, BLOOMFILTER => ¨NONE¨, REPLICATION_SCOPE => ¨0¨, COMPRESSION => ¨NONE¨, VERSIONS =>                                ¨3¨, TTL => ¨2147483647¨, BLOCKSIZE => ¨65536¨, IN_MEMORY => ¨false¨, BLOCKCACHE => ¨true¨}]}                                      1 row(s) in 0.0100 seconds

 輸出的格式也是JSON串的形式,從中可以看到保留的版本數,TTL號(Time to Live,保留時間),列的定義,塊大小等等。 

修改表對象,修改(含刪除)前必須首先禁用對象,執行修改命令成功後,再啟用對象。 

禁用對象:

  hbase(main):004:0> disable ¨t¨ 0 row(s) in 2.0430 seconds

 判斷當前表對象啟用或禁用:

  hbase(main):007:0> is_enabled ¨t¨ false                                                                                   0 row(s) in 0.0040 seconds  hbase(main):008:0> is_disabled ¨t¨ true                                                                                   0 row(s) in 0.0040 seconds

 修改表對象,增加一個列族:

 hbase(main):021:0> alter ¨t¨, {NAME => ¨t_info¨, VERSIONS => 3}    0 row(s) in 0.0360 seconds  hbase(main):023:0> enable ¨t¨ 0 row(s) in 2.0250 seconds

 插入記錄: 

 hbase(main):025:0> put ¨t¨,¨10001¨,¨t_vl:name¨,¨jss¨ 0 row(s) in 0.0060 seconds  hbase(main):026:0> put ¨t¨,¨10001¨,¨t_vl:age¨,¨99¨ 0 row(s) in 0.0070 seconds  hbase(main):027:0> put ¨t¨,¨10001¨,¨t_info:general¨,¨his fullname is junsanis!¨  0 row(s) in 0.0040 seconds 

記錄擷取:

 hbase(main):028:0> get ¨t¨,¨10001¨ COLUMN                   CELL                                                             t_info:general               timestamp=1365670813664, value=his fullname is junsanis!                                   t_vl:age                  timestamp=1365670733223, value=99                                               t_vl:name                 timestamp=1365670723056, value=jss                                              3 row(s) in 0.0450 seconds 

擷取指定記錄中指定列族的資料:

 hbase(main):029:0> get ¨t¨,¨10001¨,¨t_vl¨ COLUMN                   CELL                                                             t_vl:age                  timestamp=1365670733223, value=99                                               t_vl:name                 timestamp=1365670723056, value=jss                                              2 row(s) in 0.0070 seconds

 擷取指定記錄中指定列族中指定列的資料:

  hbase(main):030:0> get ¨t¨,¨10001¨,¨t_vl:age¨ COLUMN                   CELL                                                             t_vl:age                  timestamp=1365670733223, value=99                                               1 row(s) in 0.0070 seconds

 記錄更新(跟插入沒有區別):

 hbase(main):031:0> put ¨t¨,¨10001¨,¨t_vl:age¨,¨10¨ 0 row(s) in 0.0050 seconds  hbase(main):032:0> get ¨t¨,¨10001¨,¨t_vl:age¨ COLUMN                   CELL                                                             t_vl:age                  timestamp=1365670912700, value=10                                               1 row(s) in 0.0080 seconds 

全表掃描:

 hbase(main):033:0> scan ¨t¨ ROW                     COLUMN+CELL                                                          10001                   column=t_info:general, timestamp=1365670813664, value=his fullname is junsanis!                        10001                   column=t_vl:age, timestamp=1365670912700, value=10                                      10001                   column=t_vl:name, timestamp=1365670723056, value=jss                                     1 row(s) in 0.0370 seconds

全表描述某個列:

hbase(main):036:0> scan ¨t¨, {COLUMNS => ¨t_vl¨} ROW                     COLUMN+CELL                                                          10001                   column=t_vl:age, timestamp=1365670912700, value=10                                      10001                   column=t_vl:name, timestamp=1365670723056, value=jss                                     1 row(s) in 0.0080 seconds

刪除記錄行:

  hbase(main):043:0> delete ¨t¨,¨10001¨,¨t_vl:age¨ 0 row(s) in 0.0050 seconds  hbase(main):045:0> get ¨t¨,¨10001¨ COLUMN                   CELL                                                             t_info:general               timestamp=1365670813664, value=his fullname is junsanis!                                   t_vl:name                 timestamp=1365670723056, value=jss                                              2 row(s) in 0.0070 seconds

 刪除表:

  hbase(main):047:0> disable ¨t¨ 0 row(s) in 2.0230 seconds  hbase(main):048:0> drop ¨t¨ 0 row(s) in 1.1170 seconds

 看完前面的例子,大家有沒有問題,或者想到了什嗎?我腦子裡反正是蹦出問號了:HBase中沒有UPDATE操作,只有INSERT,可是我們每次put新記錄都替換掉了舊的版本,怎麼儲存大量記錄呢?難道每個row key的columns中只能存在一條記錄?這不科學!這也顯然不是人民群眾期待並且喜聞樂見的表現嘛。 

這個問題呀,其實是列值儲存版本(VERSIONS)或保留時間(TTL, Time to Liv)在起作用。 

比如,我們希望統計某使用者的最近(n條)瀏覽記錄,那麼,建立HBase表對象如下: 

hbase> create ¨rlog¨,¨userid¨,{NAME=>¨article¨,VERSIONS=>100} 

當前設定,保留最近的100個版本。當使用者瀏覽文章時,就向rlog表中插入一條記錄,形式如下: 

hbase> put ¨rlog¨,$userid,¨article:id¨,$aid 

這裡僅選擇記錄瀏覽的使用者ID和瀏覽頁面ID,也可以根據實際情況,儲存頁面的URL地址,文章標題等等資訊。HBase表列族是非結構化的,大家可以根據需求任意增加列值。

那麼,要擷取使用者最近瀏覽記錄,應該怎麼查呢?,比如說擷取最近瀏覽的10條記錄: 

hbase> get ¨rlog¨,$userid,{COLUMN=>¨article:id¨, VERSIONS=>10}

 除了通過VERSIONS控制外,還可以考慮通過版本的儲存時間TTL來控制,TTL的單位是秒,預設一般是儲存30天。

感謝閱讀,希望能協助到大家,謝謝大家對本站的支援!

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.