EMC Greenplum增非結構化大資料分析功能

來源:互聯網
上載者:User
關鍵字 分析功能 非結構化大資料

EMC今天宣佈Hadoop Data Computing Appliance(DCA)設備中增加了一項新功能,允許使用者將非結構化與結構化資料分析平臺結合起來。

EMC還公佈了Greenplum Analytics Workbench——一個針對Apache Hadoop軟體集成測試的1000節點測試台。

該測試台為Hadoop開源社區提供了測試資源以快速識別錯誤、穩定新版本以及優化硬體設定,努力加快Hadoop的創新。 所有測試和結果都將返回至Apache Software Foundation和開源社區。 EMC的測試將與Apache Hadoop專案相協調。

在Greenplum設備產品方面EMC推出了Modular Data Computing Appliance,允許使用者將一個大規模並行處理關係資料庫與企業級Apache Hadoop結合到一個統一的設備中, 以實現結構化與非結構化資料的處理。

Greenplum在去年10月推出Data Computing Appliance,今年5月發佈了一個升級版本DCA,其中包括一款Hadoop設備。

Greenplum HD (Hadoop) DCA構建于英特爾x86伺服器之上,採用Greenplum(EMC在去年收購)所搭建的結構化資料庫與Apache開源版本的Hadoop。 該設備的舊版本是基於Sun Fire x64伺服器的。

據EMC資料計算部門產品副總裁、Greenplum共同創始人Scott Yara表示,管理員可以並行地從Greenplum讀寫檔至HDFS(Hadoop File System),實現快速資料共用。 使用Greenplum SQL和高級分析功能在HDFS上讀取資料,可以進行跨平臺的分析。

新的Modular DCA通過SAS Institute的In-Memory Analytics軟體形式,增加了高性能計算模組,可服務于結構化資料(例如資料庫)和非結構化資料。

Yara表示:「主要挑戰是,它可以利用伺服器記憶體,通過使用來自SAS Institute的業務分析軟體執行並行處理。 我們希望提供提供一種類似于樂高積木構建塊的架構。 」

通過使用In-Memory Analytics軟體,結構化和非結構化資料可以存在於多個x86主機上,其目的是允許使用者在一個集群配置的每個伺服器節點的記憶體上執行計算。

Yara表示:「這款設備的強大之處在于它並行地執行所有這些複雜問題。 」新的Modular DCA正在進行產品測試,預計將在今年年底供貨。

(責任編輯:蒙遺善)

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.