文章目錄
- 3.4.1、Map的過程
- 3.4.2、Reduce的過程
我們通過下面這個天氣資料處理的例子來說明Hadoop的運行原理.
1、Map-Reduce的邏輯過程
假設我們需要處理一批有關天氣的資料,其格式如下:
- 按照ASCII碼儲存,每行一條記錄
- 每一行字元從0開始計數,第15個到第18個字元為年
- 第25個到第29個字元為溫度,其中第25位是符號+/-
0067011990999991950051507+0000+ 0043011990999991950051512+0022+ 0043011990999991950051518-0011+ 0043012650999991949032412+0111+ 0043012650999991949032418+0078+ 0067011990999991937051507+0001+ 0043011990999991937051512-0002+ 0043011990999991945051518+0001+ 0043012650999991945032412+0002+ 0043012650999991945032418+0078+ |
現在需要統計出每年的最高溫度。
Map-Reduce主要包括兩個步驟:Map和Reduce
每一步都有key-value對作為輸入和輸出:
- map階段的key-value對的格式是由輸入的格式所決定的,如果是預設的TextInputFormat,則每行作為一個記錄進程處理,其中key為此行的開頭相對於檔案的起始位置,value就是此行的字元文本
- map階段的輸出的key-value對的格式必須同reduce階段的輸入key-value對的格式相對應
對於上面的例子,在map過程,輸入的key-value對如下:
(0, 0067011990999991950051507+0000+) (33, 0043011990999991950051512+0022+) (66, 0043011990999991950051518-0011+) (99, 0043012650999991949032412+0111+) (132, 0043012650999991949032418+0078+) (165, 0067011990999991937051507+0001+) (198, 0043011990999991937051512-0002+) (231, 0043011990999991945051518+0001+) (264, 0043012650999991945032412+0002+) (297, 0043012650999991945032418+0078+) |
在map過程中,通過對每一行字串的解析,得到年-溫度的key-value對作為輸出:
(1950, 0) (1950, 22) (1950, -11) (1949, 111) (1949, 78) (1937, 1) (1937, -2) (1945, 1) (1945, 2) (1945, 78) |
在reduce過程,將map過程中的輸出,按照相同的key將value放到同一個列表中作為reduce的輸入
(1950, [0, 22, –11]) (1949, [111, 78]) (1937, [1, -2]) (1945, [1, 2, 78]) |
在reduce過程中,在列表中選擇出最大的溫度,將年-最大溫度的key-value作為輸出:
(1950, 22) (1949, 111) (1937, 1) (1945, 78) |
其邏輯過程可用如表示:
大概描述了Map-Reduce的Job啟動並執行基本原理:
下面我們討論JobConf,其有很多的項可以進行配置:
- setInputFormat:設定map的輸入格式,預設為TextInputFormat,key為LongWritable, value為Text
- setNumMapTasks:設定map任務的個數,此設定通常不起作用,map任務的個數取決於輸入的資料所能分成的input split的個數
- setMapperClass:設定Mapper,預設為IdentityMapper
- setMapRunnerClass:設定MapRunner, map task是由MapRunner啟動並執行,預設為MapRunnable,其功能為讀取input split的一個個record,依次調用Mapper的map函數
- setMapOutputKeyClass和setMapOutputValueClass:設定Mapper的輸出的key-value對的格式
- setOutputKeyClass和setOutputValueClass:設定Reducer的輸出的key-value對的格式
- setPartitionerClass和setNumReduceTasks:設定Partitioner,預設為HashPartitioner,其根據key的hash值來決定進入哪個partition,每個partition被一個reduce task處理,所以partition的個數等於reduce task的個數
- setReducerClass:設定Reducer,預設為IdentityReducer
- setOutputFormat:設定任務的輸出格式,預設為TextOutputFormat
- FileInputFormat.addInputPath:設定輸入檔案的路徑,可以使一個檔案,一個路徑,一個萬用字元。可以被調用多次添加多個路徑
- FileOutputFormat.setOutputPath:設定輸出檔案的路徑,在job運行前此路徑不應該存在
當然不用所有的都設定,由上面的例子,可以編寫Map-Reduce程式如下:
public class MaxTemperature { public static void main(String[] args) throws IOException { if (args.length != 2) { System.err.println("Usage: MaxTemperature <input path> <output path>"); System.exit(-1); } JobConf conf = new JobConf(MaxTemperature.class); conf.setJobName("Max temperature"); FileInputFormat.addInputPath(conf, new Path(args[0])); FileOutputFormat.setOutputPath(conf, new Path(args[1])); conf.setMapperClass(MaxTemperatureMapper.class); conf.setReducerClass(MaxTemperatureReducer.class); conf.setOutputKeyClass(Text.class); conf.setOutputValueClass(IntWritable.class); JobClient.runJob(conf); } } |
3、Map-Reduce資料流(data flow)
Map-Reduce的處理過程主要涉及以下四個部分:
- 用戶端Client:用於提交Map-reduce任務job
- JobTracker:協調整個job的運行,其為一個Java進程,其main class為JobTracker
- TaskTracker:運行此job的task,處理input split,其為一個Java進程,其main class為TaskTracker
- HDFS:hadoopDistributed File System,用於在各個進程間共用Job相關的檔案
3.1、任務提交
JobClient.runJob()建立一個新的JobClient執行個體,調用其submitJob()函數。
- 向JobTracker請求一個新的job ID
- 檢測此job的output配置
- 計算此job的input splits
- 將Job運行所需的資源拷貝到JobTracker的檔案系統中的檔案夾中,包括job jar檔案,job.xml設定檔,input splits
- 通知JobTracker此Job已經可以運行了
提交任務後,runJob每隔一秒鐘輪詢一次job的進度,將進度返回到命令列,直到任務運行完畢。
3.2、任務初始化
當JobTracker收到submitJob調用的時候,將此任務放到一個隊列中,job調度器將從隊列中擷取任務並初始化任務。
初始化首先建立一個對象來封裝job啟動並執行tasks, status以及progress。
在建立task之前,job調度器首先從共用檔案系統中獲得JobClient計算出的input splits。
其為每個input split建立一個map task。
每個task被分配一個ID。
3.3、任務分配
TaskTracker周期性的向JobTracker發送heartbeat。
在heartbeat中,TaskTracker告知JobTracker其已經準備運行一個新的task,JobTracker將分配給其一個task。
在JobTracker為TaskTracker選擇一個task之前,JobTracker必須首先按照優先順序選擇一個Job,在最高優先順序的Job中選擇一個task。
TaskTracker有固定數量的位置來運行map task或者reduce task。
預設的調度器對待map task優先於reduce task
當選擇reduce task的時候,JobTracker並不在多個task之間進行選擇,而是直接取下一個,因為reduce task沒有資料本地化的概念。
3.4、任務執行
TaskTracker被分配了一個task,下面便要運行此task。
首先,TaskTracker將此job的jar從共用檔案系統中拷貝到TaskTracker的檔案系統中。
TaskTracker從distributed cache中將job運行所需要的檔案拷貝到本地磁碟。
其次,其為每個task建立一個本地的工作目錄,將jar解壓縮到檔案目錄中。
其三,其建立一個TaskRunner來運行task。
TaskRunner建立一個新的JVM來運行task。
被建立的child JVM和TaskTracker通訊來報告運行進度。
3.4.1、Map的過程
MapRunnable從input split中讀取一個個的record,然後依次調用Mapper的map函數,將結果輸出。
map的輸出並不是直接寫入硬碟,而是將其寫入緩衝memory buffer。
當buffer中資料的到達一定的大小,一個背景線程將資料開始寫入硬碟。
在寫入硬碟之前,記憶體中的資料通過partitioner分成多個partition。
在同一個partition中,背景線程會將資料按照key在記憶體中排序。
每次從記憶體向硬碟flush資料,都產生一個新的spill檔案。
當此task結束之前,所有的spill檔案被合并為一個整的被partition的而且排好序的檔案。
reducer可以通過http協議請求map的輸出檔案,tracker.http.threads可以設定http服務線程數。
3.4.2、Reduce的過程
當map task結束後,其通知TaskTracker,TaskTracker通知JobTracker。
對於一個job,JobTracker知道TaskTracer和map輸出的對應關係。
reducer中一個線程周期性的向JobTracker請求map輸出的位置,直到其取得了所有的map輸出。
reduce task需要其對應的partition的所有的map輸出。
reduce task中的copy過程即當每個map task結束的時候就開始拷貝輸出,因為不同的map task完成時間不同。
reduce task中有多個copy線程,可以並行拷貝map輸出。
當很多map輸出拷貝到reduce task後,一個背景線程將其合并為一個大的排好序的檔案。
當所有的map輸出都拷貝到reduce task後,進入sort過程,將所有的map輸出合并為大的排好序的檔案。
最後進入reduce過程,調用reducer的reduce函數,處理排好序的輸出的每個key,最後的結果寫入HDFS。
3.5、任務結束
當JobTracker獲得最後一個task的運行成功的報告後,將job得狀態改為成功。
當JobClient從JobTracker輪詢的時候,發現此job已經成功結束,則向使用者列印訊息,從runJob函數中返回。