Hadoop自訂類型處理手機上網日誌

來源:互聯網
上載者:User

標籤:mit   tostring   rac   分析   let   sub   span   定義類   自訂   

job提交源碼分析

在eclipse中的寫的代碼如何提交作業到JobTracker中的哪?
(1)在eclipse中調用的job.waitForCompletion(true)實際上執行如下方法
  connect();
  info = jobClient.submitJobInternal(conf);
(2)在connect()方法中,實際上建立了一個JobClient對象。
  在調用該對象的構造方法時,獲得了JobTracker的用戶端代理對象JobSubmissionProtocol。
  JobSubmissionProtocol的實作類別是JobTracker。
(3)在jobClient.submitJobInternal(conf)方法中,調用了
  JobSubmissionProtocol.submitJob(...),
  即執行的是JobTracker.submitJob(...)。

 

Hadoop資料類型

1.Hadoop的資料類型要求必須實現Writable介面
2.java基本類型與Hadoop常見基本類型的對照
    Long    LongWritable
    Integer    IntWritable
    Boolean   BooleanWritable
    String    Text


java類型如何轉化為hadoop基本類型?
    調用hadoop類型的構造方法,或者調用set()方法。
      new LongWritable(123L);

hadoop基本類型如何轉化為java類型?
    對於Text,需要調用toString()方法,其他類型調用get()方法。

 

使用Hadoop自訂類型處理手機上網日誌

1、首先,將手機上網記錄檔HTTP_20130313143750.dat通過WinSCP工具複製到/usr/local目錄下

2、將記錄檔上傳到hdfs://chaoren:9000/wlan檔案夾下

 

記錄檔:

 記錄檔中各欄位含義:

 

 3、編寫Java代碼將記錄檔中想要的資料統計出來。

 

Hadoop自訂類型處理手機上網日誌

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.