雲計算帶熱大資料,大資料炒高Hadoop。
前幾年的資料技術就已經站在了存儲領域的尖端,各種分析研究所指的資料的爆炸趨勢,使得大資料不可避免的成了眾多廠商的一個新宣傳點或者說是戰略目標,提醒人們要換個角度去思考PB級的存儲。
EMC、IBM、惠普、Oracle、NetApp在內的主流存儲廠商都鋪開了自己的大通話方案,就像當年雲計算的風風火火一樣,大資料領域變得更加擁擠,廠商紛紛在調整各自的定位與戰略以搶佔先機。
那麼,2012年大資料領域將會有什麼新的變化和動向呢? 我們看到,大資料廠商的成長,正在帶動Hadoop的迅速升溫。
Hadoop是一種基於免費許可、支援資料密集型分散式應用的軟體框架,建立在MapReduce技術上,使應用可以處理數千個節點和PB級資料,讓資料處理和資料分析變得更加方便快捷,應用於企業中將改變很多企業的業務模式, 它包括但並不局限于分散式運算Hadoop。
Hadoop在可伸縮性、強健性、性能和成本上具有無可替代的優勢,事實上已成為當前互聯網企業主流的大資料分析平臺。
Hadoop似乎已經變得無處不在,EMC、戴爾、IBM、甚至微軟都已經開始躋身Hadoop陣營。 例如,EMC推出了針對常用於資料密集型分散式應用的Apache Hadoop開源軟體以及高性能的Hadoop專用資料協同處理設備——Greenplum HD資料計算裝置(Data Computing Appliance)。
戴爾宣佈與Cloudera新的合作夥伴關係從而加入了日益龐大的Apache Hadoop俱樂部。
IBM則利用IBM InfoSphere BigInsights軟體,在SmartCloud Enterprise上運行Hadoop。
連微軟也開始涉足Hadoop領域,宣佈在Windows Azure和SQL Server中整合Hadoop-as-a-Service服務,在2012年提供給那些在其平臺上處理大資料的公司。
眾多廠商擁抱Hadoop,說明客戶和開發者需要有能夠應對各種大資料的工具。
事實上現在有很多調查報告都指出,有許多企業機構都在考慮或者正在使用Hadoop平臺進行資料採礦,執行大量以前不可能實現的資料分析,應對非結構化資料並更好地利用計算資源。
而且,為了充分利用Hadoop和類似技術,軟體發展商們也在開源社區裡開發出各種各樣的技術。 雖然開源技術還沒有得到商業支援。 但根據IDC預計,年內至少有三家商業公司會給予Hadoop支援。 同時, 不少廠商將發佈配有Hadoop元件的分析工具,這種工具能説明企業開發自己的應用程式。
從長遠來看,Hadoop也將發展到人們對此瞭解並不深入但幾乎大家都聽說過的階段。 一旦遇到涉及大量非結構化的資料獲取和處理時,Hadoop就會有很大的用武之地,相信明年將是Hadoop大展拳腳的一年。