MaxCompute巨量資料實踐,電商資料倉儲選擇雪花還是星型型號?

來源:互聯網
上載者:User

摘要: 作者:王永偉正常化和反正常化 當屬性層次被產生實體為一系列維度,而不是單一的維度時,此圖樣被稱為雪花圖樣。大多數線上交易處理系統(OLTP)的底層資料結構在設計階段採用此種正常化技術,通過正常化處理將重複屬性移至其自身所屬的表中,移除冗餘數據。

作者:王永偉

正常化和反正常化

當屬性層次被產生實體為一系列維度,而不是單一的維度時,此圖樣被稱為雪花圖樣。大多數線上交易處理系統(OLTP)的底層資料結構在設計階段採用此種正常化技術,通過正常化處理將重複屬性移至其自身所屬的表中,移除冗餘數據。

此種方法用在OLTP系統中可以有效避免資料冗餘導致的不一致性。比如在OLTP系統中,存在商品表和類目表,且商品表中冗餘有類目表的屬性欄位,假設對某類目進行更新,則必須更新商品表和類目表,且由於商品和類目是一對多的關聯,商品表可能每次需要更新幾十萬甚至上百萬條記錄,這是不合理的。而對於線上分析處理系統(OLAP),資料是穩定的,不存在OLTP系統中存在的問題。

對於淘系商品維度,如果採用雪花圖樣進行正常化處理,將表現為如下形式:

cb25a1387dc39f1fafa48151177a48438a9c93a4

更多數倉理論請追隨:《巨量資料之路:阿裡巴巴巨量資料實踐》


推薦幾種建模工具:ERStudio / ERWin / PowerDesigner


相關產品:

  1. 巨量資料計算服務(MaxCompute)
相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.