標籤:
如今,從小型初創企業到行業巨頭,各種規模的供應商都在使用開源來處理大資料和運行預測性分析。本文介紹了一些大資料方面的頂級開源工具,分為四個領域:資料存放區,開發平台,開發工具和整合,分析和報告工具。
隨著大資料與預測性分析的成熟,開源作為底層技術授權解決方案的最大貢獻者的優勢越來越明顯。
如今,從小型初創企業到行業巨頭,各種規模的供應商都在使用開源來處理大資料和運行預測性分析。藉助開源與雲端運算技術,新興公司甚至在很多方面都可以與大廠商抗衡。
以下是一些大資料方面的頂級開源工具,分為四個領域:資料存放區、開發平台、開發工具和整合、分析和報告工具。
資料存放區:
- Apache Hadoop– Cloud Foundry(VMware), Hortonworks, Hadapt
- NoSql 資料庫 – MongoDB, Cassandra, Hbase
- SQL 資料庫 – MySql(Oracle), MariaDB, PostgreSQL, TokuDB
開發平台:
- Apache Hadoop平台 – Impala(開源大資料分析引擎); Lingual(ANSI SQL); Pattern(analytics); Cascading(開源大資料應用程式開發架構)
- Apache Lucene和 Solr平台
- OpenStack(構建私人雲端和公用雲端)
- Red Hat (搭載 Hadoop 伺服器的標準 Linux 發行版)
- REEF(微軟的Hadoop開發人員平台)
- Storm(整合了各種排隊系統和資料庫系統)
開發工具和整合:
- Apache Mahout(機器學習的程式設計語言)
- Python 和 R(預測性分析程式設計語言)
分析和報告工具:
- Jaspersoft(報告和分析伺服器)
- Pentaho(Data Integration和業務分析)
- Splunk(IT分析平台)
- Talend(大Data Integration,資料管理和應用整合)
以上就是我們總結的大資料方面不錯的工具,希望對您有所協助。
英文原文: blackducksoftware
大資料領域的頂級開源工具大集合