Hadoop大資料分析獲本地R語言支援

來源:互聯網
上載者:User

隨著大家對大資料分析越來越感興趣,軟體供應商Revolution HTTP://www.aliyun.com/zixun/aggregation/16353.html"> Analytics改進了其R語言統計功能旗艦產品,使它能夠與Hadoop資料處理平臺運行。

這個新的Revolution R Enterprise 7(RRE 7)還能夠使R在Teradata資料庫內運行。

R語言提供了一種方法來對一組資料運行常用統計測試(例如線性和非線性建模、時間序列分析、分類和聚類),通常結果是以圖形的形式出現。

R越來越多地用於複雜的資料分析,即那些超出標準商業智慧套裝程式範圍的資料分析。 Revolution Analytics公司預計全世界有超過200萬人在使用R。

RRE7包含R演算法庫——可以跨多個節點並行運行,這與Hadoop管理大資料集的方式相同。 RRE7可以被添加到Cloudera CDH3和CDH4 Hadoop發行版本,以及Hortonworks資料平臺1.3。

這個新的R庫保護最常用的統計和預測分析演算法,用於資料處理、資料採樣、描述性統計、統計測試、資料視覺化、模擬、機器學習和預測模型等任務。

通過分析節點內的資料,而不是移動資料到其他位置進行分析,基於R的資料分析可以更快地進行。 它還允許對一整組資料進行分析,而不是資料的子集或者摘要--企業資料倉儲(EDW)通常是採用這樣的方式。

Revolution Analytics希望將R加入到Hadoop和Teradata資料庫可以拓寬該語言的使用範圍。 該公司還設計了一個新的工作流程介面,其中不需要知道如何部署特定的R演算法。 這緩解了使用JAVA或者其他語言程式設計R的麻煩,讓其在Hadoop平臺運行。

  除了支援這些新的平臺,RRE7還採用了一些新的演算法和流程。 其一是建立Decision Forests的模型集,Decision Forests是用於預測未來結果的機器學習技術。 新的Stepwise Regression功能還可以説明我們自動化選擇用於預測模型中最重要的變數。 新的Decision Tree視覺化可以提供圖形化的方式來描述資料集內複雜的關係和相關性。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.