【IT168 評論】Hadoop這一備受矚目的技術隨著大資料的發展愈發火爆起來,許多廠商以擁有Hadoop或類似技術進入大資料領域。 在剛剛舉辦的Strata+Hadoop World大會上,這些廠商就發佈了各自的大資料產品,並且大多與Hadoop密切相關。
本文將對十家主流大資料廠商的創新技術進行盤點:
1.Cloudera。 Cloudera是一家專業從事基於Apache Hadoop的資料管理軟體銷售和服務的公司,它發佈了即時查詢開源專案Impala 1.0 Beta版,比原來基於MapReduce的Hive SQL查詢速度提升3~90倍。 Impala是Google Dremel的模仿,但在SQL功能上青出於藍勝於藍,而且更加靈活易用。
2.Splunk。 美國商業智慧軟體供應商Splunk公司發佈了Splunk Hadoop Connect和Splunk App for HadoopOps。 前者可提供雙向集成,輕鬆可靠地完成在Splunk與Hadoop之間遷移資料,後者可對端到端Hadoop環境的健康和性能進行即時監控和分析。
3.EMC。 EMC公司是全球資訊存儲及管理產品、服務和解決方案供應商,其公佈EMC Greenplum Chorus開原始程式碼,並與Kaggle合作挖掘大資料科學家的社交平臺。 Kaggle是囊括了55000多名資料科學家的社交平臺,所有Chorus社區的成員實現與Kaggle中資料專家的對接。 除此以外,Actuate,ADVIZOR Solutions,Alpine Data Labs,Gnip,Informatica,Pentaho,Pervasive,SAS,Syncsor以及Tableau Software都會將自己的工具與方案與Chorus整合。
4.MapR。 知名商業Hadoop供應商MapR宣佈新的大資料平臺MapR M7,為Hadoop與NoSQL提供更為方便、可靠和快速的服務。 通過MapR M7,大資料範圍從批量分析到即時資料庫功能能都可以達到企業級標準。 技術上看,MapR M7可以將HBase性能進行大幅提升。 MapR M7可以簡化HBase的管理,確保沒有單獨進程需要監控和管理,不用手動壓縮與合併,不需要人工資料庫修復操作,保證不停機即可實現維修。
5.SAP。 全球企業管理軟體與解決方案的供應商SAP公司宣佈通過一個新的「big data」 捆綁方案將Apache Hadoop整合到即時資料倉儲環境中,其基礎是SAP HANA平臺並結合SAP Sybase IQ server、SAP Data Integrator software、SAP BusinessObjects business intelligence (BI) solutions,目標是為不同來源的大規模資料集提供了全面的資料倉儲解決方案。 通過這些集成方案,HDFS或Hive資料庫中的資料可以迅速進入SAP HANA或者SAP Sybase IQ,説明使用者使用現有報告及分析工具實現BI。
6.微軟。 微軟宣佈在Windows Server及Azure產品中整合Apache Hadoop,可降低企業部署與管理Hadoop的困難,以便從公司自有系統或雲計算上任何大小的任何資料獲得分析洞察,微軟技術院士David Campbell認為,新產品使用者還可以使用Excel、PowerPivot for Excel及Power View等熟悉工具,以便抓取分析用的資料。
7.Simba。 Simba公司宣佈推出針對NoSQL的大資料驅動程式套件,允許任何基於SQL資料庫分析或報告工具訪問任何的NoSQL資料資源,進而實現商業智慧,如ApacheHadoop/Hive,Apache Cassandra, Google BigQuery,MongoDB。
8.Datameer。 Hadoop海量資料分析平臺Datameer宣佈推出Datameer Analytic Applications Market和免費試用版Datameer 2.1。 通過這一平臺,資料科學家和中小企業領域專家可以創建、封裝並銷售相關的分析應用程式,以快速滿足不同的使用者大資料分析需求;企業也不用花費大量時間與資源構建解析模型,而是通過這樣的App Market儘快以最小成本獲得Hadoop的應用程式和代碼。 Datameer應用是構建在Hadoop上的分析應用,其可以對任何類類型或數量的資料,無論大小、結構化、半結構化還是非機構化資料進行處理。
9.Tableau Software。 西雅圖資料分析公司Tableau Software宣佈與合作夥伴一起提供桌面、企業端、網路和行動裝置等方面的視覺分析整體方案。 Tableau Software已經構建廣泛的生態系統,可以滿足基於Hadooop架構的各類BI需求。
10.SiSense。 SiSense宣佈推出世界上最小的大資料分析解決方案——SiSense Prism ,旨在滿足中小企業、創業企業的資料分析需求。 其方案可以在僅有8GB RAM記憶體的筆記本上分析1TB資料。 不需要龐大的預算、昂貴的硬體或資料倉儲,僅需要一小部分投資,SiSense Prism 包含一個高性能分析資料庫,簡單的資料提取(ETL)和基於網路的資料視覺化。
綜上所述,Hadoop的魅力已經吸引到眾多IT廠商的目光,以Hadoop為主線的大資料產品正在影響著大資料超市的發展,雖然大資料不等於Hadoop,但是Hadoop的地位已無法取代。