Apache Hadoop已成為大資料行業發展背後的驅動力

來源:互聯網
上載者:User
關鍵字 流量 每天 他們

隨著互聯網技術的發展,當今網路中每天都在產生海量的資訊,這其中包括半結構化和非結構化的資料。 組織可以通過對海量資訊的分析瞭解到他們客戶真正需要的以及為什麼需要的原因。 如今Apache Hadoop已成為大資料行業發展背後的驅動力。

Facebook的工程師相信他們運行著最大的基於Hadoop的資料收集平臺。 Facebook基礎設施工程副總裁Jay Parikh表示Facebook大多數的網站資料存儲在單一的集群之中,容量可達100PB,Facebook的集群相比于其他公司的集群可謂是獨樹一幟。

Facebook產品團隊部門通過(每30分鐘掃描105TB的資料的過程)來衡量產品,同時Facebook管理著數以百萬計的照片和數十億like按鈕流量日誌,以便根據使用者的喜好為使用者推薦喜歡的內容。

以下為Facebook每天的資料流量

每天27億like按鈕流量 3億張照片上傳到Facebook 70000查詢執行(人工或自動化) 超過500TB的資料增長量

原文連結:CNET(李智/編譯 張志平/審校)

(責任編輯:蒙遺善)

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.