來源:互聯網
上載者:User
關鍵字
大資料
大資料
提供
大資料
提供
這樣
大資料
提供
這樣
發佈
大資料
提供
這樣
發佈
針對
大資料是當下IT領域最活躍的話題之一。 沒有比近日在聖約瑟舉行的Hadoop Summit 2013更好的地方去瞭解關於大資料的最新動向了。
有超過60家大資料公司參與其中,既包括像英特爾和Salesforce.com這樣的知名廠商,也有像Sqrrl和Platfora這樣成立沒有多久的初創公司。 以下是這次峰會上展示的13款全新的或者增強的大資料產品。
Continuuity開發公司現在支援批量處理
Continuuity發佈了支援批量處理的Continuuity Developer Suite 1.7,將MapReduce集成到平臺中為開發者提供更廣泛的工作負載能力。
Continuuity説明JAVA開發者構建能運行Hadoop和HBase資料庫的應用。 這些應用支援像運作分析這樣的即時應用。 但是Continuuity的首席執行官Jon Gray表示,一些應用仍然要求MapReduce的批量處理架構。
Continuuity Developer Suite 1.7還提供了一些用於流式即時分析、定位和個人化以及異常檢測的應用範本。
Datameer首次展示大資料分析軟體
Datameer發佈了面向企業使用者的Datameer 3.0資料整合和分析軟體。 該版本增加了「智慧分析」功能,可以從Hadoop中保存的大量複雜資料中自動找出模型和關聯性。
Datameer 3.0採用四種機器學習的技術:聚類、決策樹、列依賴性和建議。 雖然這些通常是資料科學家涉足的領域,但是被集成到了Datameer軟體中,這樣企業使用者就可以將其作為一項自助服務使用。
Datameer 3.0將在未來幾個月內提供給使用者進行Beta測試。
Hortonwork社區預覽支援Yarn的HDP 2.0平臺
Hortonworks將在社區中預覽下一代支援Yarn(下一代Hadoop資料處理框架)的Hortonworks Data Platform。
作為ASF Hadoop專案的一部分,Yarm旨在實現多個使用者實例,而不是單一的資料集。 HDP 2.0社區預覽版本中支援Yarn,將讓Hortonworks的合作夥伴和客戶能夠使用這項新技術,參與到最終規範的制定中,Hortonworks行銷副總裁Dave McJannet這樣表示。
Kognitio推出第八代分析平臺
Kognitio推出了新一代的Kognitio Analytic Platform,加強了多種程式設計語言之間的連線性,並提高了性能。 新版本提供了NoSQL處理能力,以及大規模並行處理任何腳本或者像R、Python或者JAVA這樣的二進位代碼。
使用該版本進行基準測試表明,它將答案返回給複雜查詢請求的速度是上一版本的兩倍。
新版本還提供了高速資料輸出,針對高速資料備份以及記憶體壓縮,作為一個可選功能。
MapR和Fusion-io聯手提高HBase性能
MapR和Fusion-io合作,在運行讀取密集型HBase應用的時候,將基於Hadoop的MapR M7大資料平臺與Fusion-io ioMemory系統結合起來,實現重要的性能提升。
據MapR稱,HBase應用性能通常受到磁片存儲瓶頸的限制。 使用Fusion-io ioMemory,MapR系統的性能提高25倍。
I/O性能的局限性,會使採用HBase開源資料庫用於高性能計算任務的速度變慢。
Pentaho添加大資料平臺集成能力
業務分析應用開發公司Pentaho,推出了所謂其軟體中的「自我調整大資料層」,提供與大資料平臺集成的能力。
這項新技術將Pentaho與Hadoop發行版本連接起來,如Cloudera、Hortonwork、MapR Technologies、Intel、NoSQL資料庫Cassandra以及MongoDB。
RainStor升級資料庫安全性及搜索能力
RainStor推出了對其資料庫軟體的重要更新,增強了安全特性,並稱這樣可以提高Hadoop在安全敏感的客戶中的採用,例如政府機構、銀行和電信公司。
RainStor資料庫中的新安全功能,它本身運行在Hadoo中,包括資料加密、資料掩蔽以及查看、審查跟蹤、防篡改、可配置的資料棄置,支援Kerberos、LDAP、Active Directory以及PAM(Linux的可插拔認證模組)。
據RainStor稱,新搜索功能提高資料庫的查詢性能達到10倍~100倍,能實現更高速的文本搜索。 現在資料庫可以搜索數十億條記錄,數PB的資料。
Splunk發佈針對Hadoop的資料分析工具
以其即時運作智慧軟體而為大家熟知的Splunk,推出了Hunk的新測試版本:Splunk Analytics for Hadoop。
Hunk集成了對Hadoop資料進行挖掘、分析和虛擬化的工具。 它採用Splunk針對資料分析的虛擬索引技術,提供了用於提供表格、圖形、自訂儀表板和報告的工具。
該軟體支援來自Cloudera、Hortonworks以及MapR的主流Hadoop發行版本。
Sqrrl發佈安全大資料平臺
初創公司Sqrrl即將推出Sqrrl Enterprise 1.1,一個用於開發即時分析應用的安全、可擴展平臺。 隨著該版本的發佈,Sqrrl將從有限的發佈階段接入全面供貨階段。
1.1版本還提供了更多基於Apache Accumulo的高級安全工具、增強的分析功能、以及像JSON這樣的特性。 新的分析功能包括全文檢索搜尋,使用Apache Lucene、SQL、統計以及圖形搜索。
Accumulo技術最初是由美國國家安全局開發的,在2011年被分拆出來作為一個開源專案。
Teradata發佈針對Hadoop的產品群組
Teradata推出了Teradata Portfolio for Hadoop,一個集硬體平臺、軟體、諮詢服務、培訓以及客戶支援的產品群組,用於開發和管理Apache Hadoop。
這其中包括Teradata Appliance for Hadoop以及Teradata Aster Big Analytics Appliance這樣的「優質平臺」可供選擇。 前者載入了Hortonworks的Hadoop發行版本、Mellanox Infiniband硬體以及Teradata的BYNET V5軟體。 後者包括Aster資料庫、SQL-MapReduce和Apache Hadoop。
Teradata還提供了針對那些希望在戴爾標準伺服器上部署Hadoop的Teradata Commodity Configuration for Hadoop產品。 Teradata Software Only for Hadoop是一個軟體捆綁產品,針對那些希望使用和配置自己的硬體的企業。
VMware支援Hadpp和大資料工作負載
VMware推出了公共測試版本的VMware vSphere Big Data Extensions,一項將VMware虛擬化平臺擴展支援Apache Hadoop和大資料處理的新特性。
企業客戶可以使用新軟體開發、運行和管理Apache Hadoop集群,以及其他通用虛擬基礎設施上的應用。 這為Hadoop系統帶來了虛擬化的好處,包括可擴充性、性能以及彈性,VMware產品管理高級總監Fausto Ibarra這樣表示。
VMware vSphere Big Data Extensions源自于VMware的Serengeti開源專案,預計在今年年底全面提供給客戶。
WANdisco發佈Hadoop新發行版本以及HA軟體