EMC今天宣佈Hadoop Data Computing Appliance(DCA)設備中增加了一項新功能,允許使用者將非結構化與結構化資料分析平臺結合起來。
EMC還公佈了Greenplum Analytics Workbench——一個針對Apache Hadoop軟體集成測試的1000節點測試台。
該測試台為Hadoop開源社區提供了測試資源以快速識別錯誤、穩定新版本以及優化硬體設定,努力加快Hadoop的創新。 所有測試和結果都將返回至Apache Software Foundation和開源社區。 EMC的測試將與Apache Hadoop專案相協調。
在Greenplum設備產品方面EMC推出了Modular Data Computing Appliance,允許使用者將一個大規模並行處理關係資料庫與企業級Apache Hadoop結合到一個統一的設備中, 以實現結構化與非結構化資料的處理。
Greenplum在去年10月推出Data Computing Appliance,今年5月發佈了一個升級版本DCA,其中包括一款Hadoop設備。
Greenplum HD (Hadoop) DCA構建于英特爾x86伺服器之上,採用Greenplum(EMC在去年收購)所搭建的結構化資料庫與Apache開源版本的Hadoop。 該設備的舊版本是基於Sun Fire x64伺服器的。
據EMC資料計算部門產品副總裁、Greenplum共同創始人Scott Yara表示,管理員可以並行地從Greenplum讀寫檔至HDFS(Hadoop File System),實現快速資料共用。 使用Greenplum SQL和高級分析功能在HDFS上讀取資料,可以進行跨平臺的分析。
新的Modular DCA通過SAS Institute的In-Memory Analytics軟體形式,增加了高性能計算模組,可服務于結構化資料(例如資料庫)和非結構化資料。
Yara表示:「主要挑戰是,它可以利用伺服器記憶體,通過使用來自SAS Institute的業務分析軟體執行並行處理。 我們希望提供提供一種類似于樂高積木構建塊的架構。 」
通過使用In-Memory Analytics軟體,結構化和非結構化資料可以存在於多個x86主機上,其目的是允許使用者在一個集群配置的每個伺服器節點的記憶體上執行計算。
Yara表示:「這款設備的強大之處在于它並行地執行所有這些複雜問題。 」新的Modular DCA正在進行產品測試,預計將在今年年底供貨。
(責任編輯:蒙遺善)