1. 程式人生 > >資料倉庫的兩種建模方法

資料倉庫的兩種建模方法

  1. 正規化建模
    • Inmon提出的集線器的自上而下(EDW-DM)的資料倉庫架構。操作型或事務型系統的資料來源,通過ETL抽取轉換和載入到資料倉庫的ODS層,然後通過ODS的資料建設原子資料的資料倉庫EDW,EDW不是多維格式的,不方便上層應用做資料分析,所以需要通過彙總建設成多維格式的資料集市層。優勢:易於維護,高度整合;劣勢:結構死板,部署週期較長
    • 正規化建模應用在EDW層
    • 一個符合第三正規化的關係必須具有以下三個條件:
      1. 每個屬性的值唯一,不具有多義性;
      2. 每個非主屬性必須完全依賴於整個主鍵,而非主鍵的一部分;
      3. 每個非主屬性不能依賴於其他關係中的屬性,因為這樣的話,這種屬性應該歸到其他關係中去。
    • 但是由於EDW的資料是原子粒度的,資料量比較大,完全規範的3正規化在資料的互動的時候效率比較低下,所以通常會根據實際情況在事實表上做一些冗餘,減少過多的資料互動。
  2. 維度建模
    • Kimball提出的匯流排式的自下而上(DM-DW)的資料倉庫架構。同樣的,操作型或事務型系統的資料來源,通過ETL抽取轉換和載入到資料倉庫的ODS層,然後通過ODS的資料,利用維度建模方法建設一致維度的資料集市。通過一致性維度可以將資料集市聯絡在一起,由所有的資料集市組成資料倉庫。優勢:構建迅速,最快的看到投資回報率,敏捷靈活;劣勢:作為企業資源不太好維護,結構複雜,資料集市整合困難。
    • 星型模型(推薦)和雪花模型

在複合式的資料倉庫架構中,操作型或事務型系統的資料來源,通過ETL抽取轉換和載入到資料倉庫的ODS層,然後通過ODS的資料,利用正規化建模方法,建設原子資料的資料倉庫EDW,然後基於EDW,利用維度建模方法建設資料集市。