Pig 在 Shell中使用,批量載入處理檔案

來源:互聯網
上載者:User

標籤:shell   pig   

首先,我想達到的目的是批量的處理一個檔案夾下的的許多文檔,這些文檔儲存了我要處理的資料,因為pig是初學,,所以不知到該怎麼批量的load,沒有寫過

自己的UDF,只能一個一個檔案的load,然後處理。

但是這個肯定不是我希望的處理方式,於是聯想到是不是可以將pig指令碼插入到shell中然後迴圈執行。

最後嘗試成功了,當然我相信pig的udf中可以自己定義這種load的方式,但是如果出於快速實現的目的可以

先使用這種方式。

下面是shell的代碼部分:

mkdir result_0925_D2for eachfile in `ls -B  | grep 00.*`do        echo $eachfile        input_=$eachfile        output_=./result_0925_D2/$input_        echo $output_        file="$input_"        file_out="$output_"        pig -param input=$file  -param output=$file_out -x local new_getResult.pigdone

其中最重要的是就是在執行pig的時候,給輸入輸出檔案迴圈的代入。

Pig 在 Shell中使用,批量載入處理檔案

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.