International - English

Cart Console

Topic Center

Contact Sales

首頁 > 熱門類別 > Big Data

大資料運算模型 MapReduce 原理

最後更新：2017-01-08 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

標籤：copy 原理分配 googl 自己技術 data span nec

大資料運算模型 MapReduce 原理2016-01-24 杜亦舒

MapReduce 是一個大資料集合的並行運算模型，由google提出，現在流行的hadoop中也使用了MapReduce作為計算模型

MapReduce 通俗解釋

圖書館要清點圖書數量，有10個書架，管理員為了加快統計速度，找來了10個同學，每個同學負責統計一個書架的圖書數量

張同學統計書架1
王同學統計書架2
劉同學統計書架3
......

過了一會兒，10個同學陸續到管理員這彙報自己的統計數字，管理員把各個數字加起來，就得到了圖書總數

這個過程就可以理解為MapReduce的工作過程

MapReduce中有兩個核心操作

（1）map

管理員分配哪個同學統計哪個書架，每個同學都進行相同的“統計”操作，這個過程就是map

（2）reduce

管理員把每個同學的結果進行匯總，這個過程就是reduce

MapReduce 工作過程拆解

下面通過一個經典案例（單詞統計）看MapReduce是如何工作的

有一個文字檔，被分成了4份，分別放到了4台伺服器中儲存

Text 1: the weather is good
Text 2: today is good
Text 3: good weather is good
Text 4: today has good weather

需求：統計出每個單詞的出現次數

處理過程

分詞處理

map節點 1

輸入：(text1, “the weather is good”)

輸出：(the, 1), (weather, 1), (is, 1), (good, 1)

map節點 2

輸入：(text2, “today is good”)

輸出：(today, 1), (is, 1), (good, 1)

map節點 3

輸入：(text3, “good weather is good”)

輸出：(good, 1), (weather, 1), (is, 1), (good, 1)

map節點 4

輸入：(text3, “today has good weather”)

輸出：(today, 1), (has, 1), (good, 1), (weather, 1)

排序

map節點 1

map節點 2

map節點 3

map節點 4

合并

map節點 1

map節點 2

map節點 3

map節點 4

匯總統計

MapReduce引入了barrier概念，有的譯為“同步障”，我理解為“分界線”，是進入reduce的一道分界線

barrier的作用是對合并結果進行組合

例如使用了3個reduce節點，需要對上面4個map節點的結果進行重新組合，把相同的單詞放在一起，並分配給3個reduce節點

reduce節點進行統計，計算出最終結果

大資料運算模型 MapReduce 原理

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

相關關鍵詞：

大資料<javaSE + Linux精英實訓班>_day_07 03-24

全球100款大資料工具匯總（前50款） 10-16

51CTO大資料學習006--集合 06-03

大數計算機 12-04

蔡先生論道大資料之(十五) ：什麼是資料化運營？ 07-24

MYSQL大資料匯入 12-08

聯繫我們

該頁面正文內容均來源於網絡整理，並不代表阿里雲官方的觀點，該頁面所提到的產品和服務也與阿里云無關，如果該頁面內容對您造成了困擾，歡迎寫郵件給我們，收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容，歡迎發送郵件至： info-contact@alibabacloud.com 進行舉報並提供相關證據，工作人員會在 5 個工作天內聯絡您，一經查實，本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

大資料運算模型 MapReduce 原理

聯繫我們

熱門內容

熱門主題

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support