1. 程式人生 > >《數據倉庫工具箱》——如何做好數據倉庫

《數據倉庫工具箱》——如何做好數據倉庫

維護 高質量 質量 架構 2.3 經典 最好 保持 介紹

最近打算閱讀一下數據倉庫相關的書籍,百度了一下,有兩本必讀書《數據倉庫工具箱》和《數據倉庫》。簡單介紹一下,《數據倉庫》這本書更像是一本教材,裏面的內容很經典;《數據倉庫工具箱》看書名是一本單純的工具書,其實裏面都是實戰。兩本書各有千秋,我決定主要閱讀《數據倉庫工具箱》,今天分享第一章的內容,以後會做系列分享。

第一章主要介紹了維度建模的好處,Kimball的歷史和技術架構,以及與其他類似架構的優劣,但其核心議題是:“如何做好數據倉庫?”

說實話這個議題很沒意思,有些枯燥,可是如果你遇到:“如何才能做好數據?為什麽需求一直做不完?數據的價值到底有多大?”那麽這下面全是幹貨。

1.1 數據倉庫與商業智能的目標

  1. DW/BI系統要能方便地存取信息。
  2. DW/BI系統必須以一致的形式展現信息。
  3. DW/BI系統必須能夠適應變化。
  4. DW/BI系統必須能夠及時展現信息。
  5. DW/BI系統必須成為保護信息財富的安全堡壘。
  6. DW/BI系統必須成為提高決策制定能力的權威和可信的基礎。
  7. DW/BI系統成功的標誌是業務群體接受DW/BI系統。

上面7點是數據倉庫設計的目標,不過重點是最後兩點

1.1.1 DW/BI系統必須成為提高決策制定能力的權威和可信的基礎。

這個是核心,我剛開始做數據倉庫的時候,設定的目標是:滿足業務查詢數據的需求。結果我在這個目標上不斷的奔跑,差點累死。暫且不提幾十個維度做笛卡爾積的查詢能否實現,就算做出來了,價值是什麽哪?為公司帶來了多少收益?如果自己的價值不能量化,那麽結果是可以想象的。所以一定要數據倉庫一定要支持決策,並且知道自己支持了哪些決策。下面是書中原文:

數據倉庫需要正確的信息以支持決策制定。DW/BI系統最重要的輸出是基於分析證據所產生的決策。這些決策體現了數據倉庫的影響和價值。早期用於表示DW/BI系統的稱謂--決策支持系統,仍可作為開展系統設計的最好描述。

1.1.2 DW/BI系統成功的標誌是業務群體接受DW/BI系統。

技術方案不重要,落地才重要,這裏我想說的是:可以不用那些高大上的技術方案,但是不能不知道它的原理。要即知道它的優點,也知道它的不適用。

是否使用最佳組合產品或平臺來構建您的體面的解決方案其實並不重要。如果業務群體不能接受DW/BI環境並積極使用它,就難言成功。對操作型系統來說,用戶無法對其加以選擇,只能使用新系統,而對DW/BI系統來說,與操作型系統不同的是,它是可選的。
只有當DW/BI系統真正成為用於構建可付諸實現的信息的"簡單快捷"的資源時,用戶才會接受它。

1.1.3 數據倉庫管理者的責任

這裏的責任大都是如何滿足用戶的需求,滿足用戶的需求不等於他提的需求都要做,而是充分理解他的kpi,理解他的目標,從這個方面入手滿足他的需求,下面是原文:

一、理解業務用戶
1.1 理解他們的工作責任、目標和任務。
1.2 確定商業用戶在制定哪些決策時需要DW/BI系統的幫助。
1.3 識別出那些制定出高效率、高影響的決策的"最佳"用戶。
1.4 發現潛在的新用戶,並讓他們意識到DW/BI系統能夠給他們帶來什麽能力。
二、對業務用戶發布高質量、相關的、可訪問的信息和分析
2.1 選擇最健壯的、可操作的數據放入DW/BI系統中,從組織機構的各種數據源中仔細選擇
2.2 簡化用戶接口和應用,采用模板驅動方式,與用戶的認知過程輪廓匹配
2.3 確保數據精確、可信,使其標識在整個企業具有一致性。
2.4 不間斷地監控數據和分析的準確性。
2.5 適應用戶不斷變化的思維方式、需求和業務優先級,及新數據源的可用性。
三、維護DW/BI環境
3.1 采用DW/BI系統制定的成功的業務決策,驗證人員配置及要投入的開支。
3.2 定期對DW/BI系統進行更新。
3.3 保持業務用戶的信任。
3.4 保持業務用戶、執行贊助商和IT管理層滿意度。

《數據倉庫工具箱》——如何做好數據倉庫