標籤:python
pig 指令碼運行不需要尾碼名
pig指令碼名為tempfile,無尾碼名用pig -f tempfile 可直接運行另外,pig tempfile也可以直接運行
這樣就可以用python臨時檔案儲存體pig指令碼內容直接調用
python調用pig指令碼的一種方式
將pig指令碼用任意檔案儲存體,執行時寫入python的臨時檔案(tempfile模組操作),執行結束後刪除。執行過程: 用tempfile模組NamedTemporaryFile產生臨時檔案,名字預設隨機,然後,可以用tempfile.name直接調用該檔案(無尾碼名.pig),pig指令碼內容存放在任意文字檔中。
這樣處理的好處是:參數傳入很方便,pig指令碼內容中參數全部使用python的格式化字串,如%s、%d,調用時讀取作為字串對象command,用%將實際參數拼入字串command,這樣就避免了使用pig指令碼 -p傳入大量參數的繁瑣。
壞處:多此一舉、麻煩。字元直接拼入-p後用 default擷取,也是極好的
pig_script = tempfile.NamedTemporaryFile(delete=False) pig_script.write(‘set default_parallel %d; SET mapred.job.queue.name %s; %s %s‘ % (config.PIG_PARALLEL, job_queue, udf_jar_str, command_piece % args)) pig_script.flush() command = ‘‘‘%s -Dmapred.cache.files="%s,%s,%s,%s" -Dmapred.create.symlink=yes -Dmapred.child.java.opts=-Xmx%dm -f %s‘‘‘ % (config.PIG_BIN, metadata_dir, quadkey_dir, region_template_dir, ipdb_file, config.PIG_TASK_MAX_MEM, pig_script.name) if logger: logger.debug(command) result = exec_command(command, task_id)
pig指令碼不需要尾碼名(python tempfile模組產生pig指令碼臨時檔案,執行)