資料倉庫-讀書筆記一
DW/Bi系統業務有哪些需求(要求)
- 方便的存取資料
- 必須以一致的形式展現資訊
- 能夠適應變化
- 及時展現資訊
- 資料安全
- 成為提高決策制定能力的權威和可信的基礎
- 業務群體接受DW/BI系統
DW/Bi系統人員有哪些需求(要求)
- 技能要求 具有較好的資訊科技基礎並且瞭解業務 既需要了解資料庫管理的技能,也包括商業分析師的 技能。
- 職責描述 理解使用者 釋出高質量、相關的、可訪問的資訊和分析 維護DW/BI環境
維度建模簡介
1. 作用
以商業使用者可理解的方式釋出資料 提供高效的查詢效能 注意:維度模型包含的資訊與規範化模型包含的資訊相同,但將資料以一種使用者可以理解的滿足查詢效能要求的,靈活多變的方式進行了包裝。
2. 星型模式與OLAP多維資料庫
OLAP採用預計算、索引策略、其它優化方法,多維資料可實現高效能查詢。 OLAP提供良好的分析效能,方便上鑽和下鑽操作 OLAP提供大量的健壯的分析函式 通常是推薦將詳細的,原子的資訊載入到星型模式中,然後將OLAP多維資料庫移植到星型模式上。
OLAP部署的注意事項
1,構建於關係資料庫之上的星型模式是建立OLAP多維資料庫的良好物理基礎。也是備份和恢復的良好的、穩定的基礎
2,OLAP對比RDBMS的效能優勢,這一優勢隨著計算機硬體和軟體的發展變得沒那麼重要
3,在不同的OLAP工具之間建立BI應用比在不同關係資料庫之間建立BI更困難。
4,OLAP多維資料通常比RDBMS提供更多的複雜安全選項。例如限制訪問細節資料
5,OLAP提供比RDBMS更加豐富的分析能力
6,OLAP方便支援緩慢變化維度型別2變化。但是當需要使用其它緩慢變化維度技術重寫資料時,多維資料庫通常需要被全部或者部分的重新處理
7,OLAP方便支援事務和週期性快照事實表,由於重寫資料的限制而無法處理累計快照事實表
8,OLAP支援具有層次不確定的複雜不規則層次結構。例如:組織結構圖或物料表
9,OLAP相對於關係資料庫,能實現對下鑽層次的維度關鍵詞結構提供更加詳細的約束
10,一些OLAP產品無法確保實現維度角色和別名,因此需要定義不同的物理維度
###3. 用於度量的事實表 **事實定義:**表示某個業務度量 **儲存什麼內容:**組織機構業務過程事件的效能度量結果。 **儲存原則:**將來源於同一個業務過程的底層度量結果儲存於一個維度模型中。 **為什麼這麼儲存:**因為資料量巨大。 **事實有哪些型別:**可加,半可加,不可加 **事實表的粒度的型別:**事務,週期性,累計快照 注意事項: 1,允許多個組織的業務使用者訪問同一個單一的集中式資料倉庫,確保他們能在整個企業中使用一致的資料。 2,物理世界的每個度量事件對應的事實錶行具有一對一的關係。每行的資料是一個特定級別的細節(粒度)資料 3,同一個事實表的度量行比具有相同的粒度
###4. 用於描述環境的維度表 儲存的內容:包含於業務過程度量事件有關的文字環境 維度表的語意:“誰(who),什麼(what),哪裡(where),何時(when),為什麼(why),如何(how)” **維度表的特點:**通常有多列(多個屬性),和事實表比較 維度表通常小的多,單一主鍵 作用:是用於和事實表連線操作時實現參照完整性的基礎,可作為查詢約束、分組、報表標識。 注意: 1,儘量減少在維度表中使用程式碼,將程式碼替換為詳細的文字屬性。儘量減少他們對程式碼轉換註釋的依賴。 2,為維度屬性提供詳細的業務術語耗費的精力越多,效果越好,強大的維度屬性帶來的回報是健壯的分片-分塊能力。 3,連續值數字基本上可以認為屬於事實,來自於不太大列表的離散數字基本可以認為是維度屬性 4,維度表可以冗餘,不一定要滿足第三正規化,通常是非規範化的。對於維度表的儲存空間的權衡 往往 關注 簡單性和可訪問性;是否方便使用,是否能提高查詢效能。 ###5. 星型模式中維度與事實的連線
##參考資料 ## 資料倉庫工具箱
如果您覺得我用心了,覺得您有所收穫,麻煩關注下我吧,您的關注就是我的動力,因為我不是一個人在前行。
DW/Bi系統業務有哪些需求(要求)
- 方便的存取資料
- 必須以一致的形式展現資訊
- 能夠適應變化
- 及時展現資訊
- 資料安全
- 成為提高決策制定能力的權威和可信的基礎
- 業務群體接受DW/BI系統
DW/Bi系統人員有哪些需求(要求)
- 技能要求 具有較好的資訊科技基礎並且瞭解業務 既需要了解資料庫管理的技能,也包括商業分析師的 技能。
- 職責描述 理解使用者 釋出高質量、相關的、可訪問的資訊和分析 維護DW/BI環境
維度建模簡介
1. 作用
以商業使用者可理解的方式釋出資料 提供高效的查詢效能 注意:維度模型包含的資訊與規範化模型包含的資訊相同,但將資料以一種使用者可以理解的滿足查詢效能要求的,靈活多變的方式進行了包裝。
2. 星型模式與OLAP多維資料庫
OLAP採用預計算、索引策略、其它優化方法,多維資料可實現高效能查詢。 OLAP提供良好的分析效能,方便上鑽和下鑽操作 OLAP提供大量的健壯的分析函式 通常是推薦將詳細的,原子的資訊載入到星型模式中,然後將OLAP多維資料庫移植到星型模式上。
OLAP部署的注意事項 1,構建於關係資料庫之上的星型模式是建立OLAP多維資料庫的良好物理基礎。也是備份和恢復的良好的、穩定的基礎 2,OLAP對比RDBMS的效能優勢,這一優勢隨著計算機硬體和軟體的發展變得沒那麼重要 3,在不同的OLAP工具之間建立BI應用比在不同關係資料庫之間建立BI更困難。 4,OLAP多維資料通常比RDBMS提供更多的複雜安全選項。例如限制訪問細節資料 5,OLAP提供比RDBMS更加豐富的分析能力 6,OLAP方便支援緩慢變化維度型別2變化。但是當需要使用其它緩慢變化維度技術重寫資料時,多維資料庫通常需要被全部或者部分的重新處理 7,OLAP方便支援事務和週期性快照事實表,由於重寫資料的限制而無法處理累計快照事實表 8,OLAP支援具有層次不確定的複雜不規則層次結構。例如:組織結構圖或物料表 9,OLAP相對於關係資料庫,能實現對下鑽層次的維度關鍵詞結構提供更加詳細的約束 10,一些OLAP產品無法確保實現維度角色和別名,因此需要定義不同的物理維度
###3. 用於度量的事實表 **事實定義:**表示某個業務度量 **儲存什麼內容:**組織機構業務過程事件的效能度量結果。 **儲存原則:**將來源於同一個業務過程的底層度量結果儲存於一個維度模型中。 **為什麼這麼儲存:**因為資料量巨大。 **事實有哪些型別:**可加,半可加,不可加 **事實表的粒度的型別:**事務,週期性,累計快照 注意事項: 1,允許多個組織的業務使用者訪問同一個單一的集中式資料倉庫,確保他們能在整個企業中使用一致的資料。 2,物理世界的每個度量事件對應的事實錶行具有一對一的關係。每行的資料是一個特定級別的細節(粒度)資料 3,同一個事實表的度量行比具有相同的粒度
###4. 用於描述環境的維度表 儲存的內容:包含於業務過程度量事件有關的文字環境 維度表的語意:“誰(who),什麼(what),哪裡(where),何時(when),為什麼(why),如何(how)” **維度表的特點:**通常有多列(多個屬性),和事實表比較 維度表通常小的多,單一主鍵 作用:是用於和事實表連線操作時實現參照完整性的基礎,可作為查詢約束、分組、報表標識。 注意: 1,儘量減少在維度表中使用程式碼,將程式碼替換為詳細的文字屬性。儘量減少他們對程式碼轉換註釋的依賴。 2,為維度屬性提供詳細的業務術語耗費的精力越多,效果越好,強大的維度屬性帶來的回報是健壯的分片-分塊能力。 3,連續值數字基本上可以認為屬於事實,來自於不太大列表的離散數字基本可以認為是維度屬性 4,維度表可以冗餘,不一定要滿足第三正規化,通常是非規範化的。對於維度表的儲存空間的權衡 往往 關注 簡單性和可訪問性;是否方便使用,是否能提高查詢效能。 ###5. 星型模式中維度與事實的連線
##參考資料 ## 資料倉庫工具箱
如果您覺得我用心了,覺得您有所收穫,麻煩關注下我吧,您的關注就是我的動力,因為我不是一個人在前行。