python語言 實現資料倉儲開發__python

來源:互聯網
上載者:User

資料倉儲架構:stg—ods—dw—rep/dm/other,基本維度日期+產品。

使用python語言實現mysql到 oracle的etl工作,檔案落地方式。

定義hss函數,程式執行入口;定義general.py公用函數;開發python.py指令碼。

 

資料架構,每一層根據業務設計規範規則

 

etl工作,extract,transform,load,

匯出檔案:資料庫本身匯出語句,

transform遠程擷取檔案,python有封裝好的包,也可以自己寫

負載檔案,資料庫本身語句,

定義檔案分隔字元,定義檔案格式

 

hss函數的實現,建立hss名sh文本,

#!/usr/bin/bash

exec /usr/bin/python/ $0 $@($0是入參指令碼名$@其他參數入參)

後面是python語言設計,檢查環境配置,擷取入參配置(對sh傳參,再傳參給python),實現靈活入參hss –s test.py –p etl_test –t 20170607 等,不像pythontest.py arg1 arg2 arg3必須指定每位的傳參。

hss其實是個別名,hss = ‘sh /path/hss’

 

 

general.py定義公用函數。

 

python.py指令碼,裡面是一個過程,該過程被hss函數調用。

test.py

def Deal:

        try:

                  sql

        except:

                  異常


模板詳見 《python語言 實現資料倉儲開發 附件》

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.