1. 程式人生 > >數據倉庫建模流程

數據倉庫建模流程

工作流程 索引 分組 做出 屬性 數據 說明 分享圖片 事務

技術分享圖片

數據模型:抽象描述現實世界的一種工具和方法,通過抽象的實體及實體之間聯系的形式,來表示現實世界中事務的相互關系的一種映射。在這裏,數據模型表現的抽象的是實體和實體之間的關系,通過對實體和實體之間關系的定義和描述,來表達實際的業務中具體的業務關系。
.
數據倉庫模型:數據模型中針對特定的數據倉庫應用系統的一種特定的數據模型,一般而言,數據倉庫模型分為以下幾個層次。
1)業務建模,生成業務模型,主要解決業務層面的分解和程序化,包括以下幾個部分:
..a)劃分整個單位的業務,一般按照業務部門劃分,進行各個部分之間業務工作的界定,理清各業務部門之間的關系。
..b)深入了解各個業務部門的內部具體業務流程並將其程序化。

..c)提出修改和改進業務部門工作流程的方法並程序化。
d)數據建模的範圍界定,整個數據倉庫項目的目標和階段劃分。
2)領域建模,生成領域模型,主要是對業務模型進行抽象處理,生成領域概念模型,包括以下幾個部分:
..a)抽取關鍵業務概念,並將之抽象化。
..b)將業務概念分組,按照業務主線聚合類似的分組概念。
..c)細化分組概念,理清分組概念內的業務流程並抽象化。
..d)理清分組概念之間的關聯,形成完整的領域概念模型。
3)邏輯建模,生成邏輯模型,主要是將領域模型的概念實體以及實體之間的關系進行數據庫層次的邏輯化,包括以下幾個部分:
..a)業務概念實體化,並考慮其具體的屬性
..b)事件實體化,並考慮其屬性內容
..c)說明實體化,並考慮其屬性內容
4)物理建模,生成物理模型,主要解決邏輯模型針對不同關系型數據庫的物理化,包括數據冗余和性能的權衡、數據類型、長度、索引、數據存儲等細節問題。包括以下幾個部分:
..a)針對特定物理化平臺,做出相應的技術調整
..b)針對模型的性能考慮,對特定平臺作出相應的調整
..c)針對管理的需要,結合特定的平臺,做出相應的調整
..d)生成最後的執行腳本,並完善

數據倉庫建模流程