想從事大資料工作,如何自學打基礎

來源:互聯網
上載者:User
關鍵字 中式 海量資料 工作 大資料

HTTP://www.aliyun.com/zixun/aggregation/13584.html">海量資料分成兩塊,一是系統建設技術,二,海量資料應用。

先說系統建設,現在主流的技術是HADOOP,主要基於mapreduce的分散式框架。 目前可以先學習這個。 但是我的觀點,在分散式系統出來之前,主要是集中式架構,如DB2,oracle。 為什麼現在用分散式架構,那是因為現在集中式架構受限於IO性能,出來速度慢,如果又一種硬體技術,可以很快地處理海量資料,性能上能滿足需求,那麼集中式架構優於分散式架構,因為集中式架構穩定,運維壓力小。 現在的集中式架構要麼性能達不到要求,要麼就是過於昂貴。 我期待一種技術出現,可以非常快地傳輸和處理資料,那麼集中式架構將再次進入人們眼球。 再說海量資料應用。 海量資料應用主要是資料採礦和機器演算法。 具體有不同的應用場景,如個人化搜索和推薦,社交網路發現,精准行銷,精准廣告,即時最優路徑,人工智慧等等。 看你想做系統支撐技術還是與業務結合的應用技術。

如果現在學系統建設技術,可以讀下如下書籍:

如果學資料採礦和機器演算法,推薦先看資料採礦導論,統計分析原理,Mahout,R,MATLAB

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.