數據倉庫之數據倉庫環境——讀書筆記
阿新 • • 發佈:2018-05-23
管理人 不同的 mage 倉庫 http alt 物理 數據集 .com 。
數據倉庫是一個面向主題的,集成的,非易失的,隨時間變化的用來支持管理人員決策的數據集合。
數據倉庫環境中數據存在不同的細節層
- 早期細節層
- 當前細節層
- 輕度綜合數據層
- 高度綜合數據層
數據倉庫只能一步一步的進行設計並載入數據,也就是說它是進化的,而非革命性的。
粒度是數據倉庫中數據單元的細節程度或者綜合程度的級別。
細節程度越高,粒度級就越低;細節程度越低,粒度級就越高。
當一個企業或者組織的數據倉庫擁有大量數據時,在細節部分采用雙重或者多重粒度級別是很有意義的。
活樣本數據庫
是從數據倉庫取得真實檔案數據或輕度綜合數據的一個子集,其中樣本是指它是一個大的數據庫的一個子集,活是指這個數據庫需要進行周期刷新
活樣本數據用來作統計分析和觀察發展趨勢,當數據必須以整體觀察時,活樣本數據庫能提供非常理想的結果,但絕不適用於處理單個數據記錄。
分區設計方法
數據分區是指將數據分散到可以獨立處理的分離物理單元中去。
數據倉庫環境中的問題是如何對當前細節數據進行分區
數據倉庫的數據組織
1. 簡單堆積數據
2. 輪轉綜合數據
3. 簡單直接文件
4. 連續文件
數據倉庫中數據的生命周期包含了數據的清理。
數據倉庫之數據倉庫環境——讀書筆記