大資料倉儲集錦

來源:互聯網
上載者:User

標籤:開源工具   統計   相關   資料管道   article   spl   map   bsp   app   

大資料目前的主要趨勢(自己理解)檔案系統、部署、各種流和開源工具-------ETL開發(BI項目)----資料統計分析------資料採礦、機器學習                                                                                                                                                 圖片來自 淺析   一、關於kakfa kafka相關       Kafka是由LinkedIn開發的一個分布式的訊息系統,使用Scala編寫,它以可水平擴充和高吞吐率而被廣泛使用。目前越來越多的開源分散式處理系統如Storm,Spark,Flink都支援與Kafka整合。現在我們的資料即時處理平台也使用到了kafka。現在它已被多家不同類型的公司作為多種類型的資料管道和訊息系統使用。 二、spark   Spark 以及 spark streaming 核心原理及實踐 三、Sqoop    sqoop 學習       將匯入或匯出命令翻譯成 MapReduce 程式來實現 在翻譯出的 MapReduce 中主要是對 InputFormat 和 OutputFormat 進行定製.
  四、FLume (部落格) 五、hive與hbase的區別  

大資料倉儲集錦

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.