來源:互聯網
上載者:User
關鍵字
開源軟體
提供
誰與爭鋒
nbsp;
作為
隨著資料時代的來臨,開源軟體越來越被重視,尤其在Web應用伺服器、應用程式架構和大資料處理方面更是應用廣泛,其中Hadoop、Apache 、MYSQL等開源軟體更是家喻戶曉,在企業大型網路應用中承擔重要作用。 免費、運行速度快等優點使開源軟體迅速發展,近一年在伺服器領域應用更是越加廣泛,下面我們來看一下未來將一段時間內伺服器行業的軟體主角。
一、HBase
HBase是一個分散式的、面向列的開源資料庫,HBase在Hadoop之上提供了類似于Bigtable的能力。 HBase是Apache的Hadoop專案的子專案。 HBase不同于一般的關係資料庫,它是一個適合於非結構化資料存儲的資料庫。 另一個不同的是HBase基於列的而不是基於行的模式。
HBase(Hadoop Database)是一個高可靠性、高性能、面向列、可伸縮的分散式存儲系統,利用HBase技術可在廉價PC Server上搭建起大規模結構化存儲集群。
HBase是Google Bigtable的開源實現,類似Google Bigtable利用GFS作為其檔存儲系統,HBase利用Hadoop HDFS作為其檔存儲系統 ;Google運行MapReduce來處理Bigtable中的海量資料,HBase同樣利用Hadoop MapReduce來處理HBase中的海量資料;Google Bigtable利用 Chubby作為協同服務, HBase利用Zookeeper作為對應。
HBase
上圖描述了Hadoop EcoSystem中的各層系統,其中HBase位於結構化存儲層,Hadoop HDFS為HBase提供了高可靠性的底層存儲支援,HadoopMapReduce為HBase提供了高性能的計算能力, Zookeeper為HBase提供了穩定服務和failover機制。
此外,Pig和Hive還為HBase提供了高層語言支援,使得在HBase上進行資料統計處理變的非常簡單。 Sqoop則為HBase提供了方便的RDBMS資料導入功能,使得傳統資料庫資料向HBase中遷移變的非常方便。
(責任編輯:蒙遺善)