四種資料ETL模式

來源:互聯網
上載者:User
根據模型的設計和來源資料的情況,有四種資料ETL模式: 完全重新整理、鏡像增量、事件增量、鏡像比較

根據模型的設計和來源資料的情況,有四種資料ETL模式:

完全重新整理:資料倉儲資料表中只包括最新的資料,每次載入均刪除原有資料,然後完全載入最新的來源資料。這種模式下,資料幫浦程式抽取來源資料中的所有記錄,在載入前,將目標資料表清空,然後載入所有記錄。為提高刪除資料的速度,一般是採用Truncate清空資料表。如本系統中的入庫當前資訊表採用此種模式。

鏡像增量來源資料中的記錄定期更新,但記錄中包括記錄時間欄位,來源資料中儲存了資料曆史的記錄,ETL可以通過記錄時間將增量資料從來源資料抽取出來以附加的方式載入到資料倉儲中,資料的記錄也會被保留在資料倉儲中。
 
事件增量:每一個記錄是一個新的事件,相互之間沒有必然的聯絡,新記錄不是對原有記錄數值的變更,記錄包括時間欄位,可以通過時間欄位將新增資料幫浦出來載入到資料庫中。

鏡像比較:資料倉儲資料具有生效日期欄位以儲存資料的曆史資訊,而來源資料不保留曆史並且每天都可能被更新。因此,只能將新的鏡像資料與上次載入的資料的鏡像進行比較,找出變更部分,更新歷史資料被更新記錄的生效終止日期,並添加變更後的資料。大多數來源資料中需儲存曆史資訊的維表

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.