1. 程式人生 > >資料倉庫--名詞解釋

資料倉庫--名詞解釋

1. ODS(Operational Data Store)

        ODS 為企業提供及時的, 操作型的, 整合的資料集合, 具有面向主題性, 整合性, 動態性, 及時性,明細性等特點.

        ODS 作為資料庫到資料倉庫的一種過渡形式, 與資料倉庫在物理結構上不同, 能提供高效能的響應時間, ODS設計採用混合設計方式.ODS中的資料是"實時值", 而資料倉庫的資料卻是"歷史值", 一般ODS中儲存的資料不超過一個月, 而資料倉庫為10年或更多.

2. 資料集市(Data Mart)

        為了特定的應用目的或應用範圍, 而從資料倉庫中獨立出來的一部分資料, 也可以稱為部門資料或主題資料(SubjectArea). 在資料倉庫的實施過程中往往可以從一個部門的資料集市著手, 以後再用幾個資料集市組成一個完整的資料倉庫. 需要注意的就是在實施不同的資料集市時,同一含義的欄位定義一定要相容,這樣再以後實施資料倉庫時才不會造成大麻煩.

3. OLAP

        聯機分析處理(On-Line Analysis Processing), 即從資料倉庫中抽取詳細資料的一個子集並經過必要的聚集, 儲存到OLAP儲存器中供前端分析工具讀取.

        OLAP系統按照儲存格式可以分為關係OLAP(Relational OLAP, ROLAP), 多維OLAP(MulitidimensionalOLAP,簡稱MOLAP) 和混合型OLAP(HybridOLAP,簡稱HOLAP)三種類型.

        ROLAP將分析要用的多維資料儲存在關係資料庫中, 並根據應用的需要有選擇的定義一檢視也儲存在關係資料庫中.

        MOLAP將OLAP分析所要用到的多維資料物理上儲存為多維陣列的形式, 形成"立方體"的結構.

        HOLAP能把MOLAP和ROLAP兩種結構的優點有機結合起來, 能 滿足使用者各種複雜的分析請求.

4. 緩慢變化維

        在實際情況下, 維度的屬性並不是靜態的, 它會隨著時間的流失發生緩慢變化.

        處理方法: 1. 新資訊直接覆蓋舊資訊; 2. 儲存多條記錄, 並新增欄位加以區分(用y,n;0,12或用時間來區別新舊記錄); 3. 另外建表儲存歷史記錄; 5. 混合模式.

5. 退化維

        一般來說事實表中的外來鍵都對應一個維表, 維的資訊主要存放在維表中. 但是退化維僅僅是事實表中的一列, 這個維的相關資訊都在這一列中, 沒有維表與之相關聯. 比如: 發票號, 序列號等.

        退化維的作用:

                1. 退化維具有普通的各種操作, 比如: 上卷, 切片, 切換等.(上卷彙總, 下鑽明細, 切片, 切塊:對二維資料進行切片, 三維資料進行切塊, 可得到所需要的資料)

                2. 如果存在退化維, 那麼在ETL的過程將會變得容易.

                3. 他可以讓group by 等操作變得更快.

6. 代理鍵

        在資料倉庫領域有一個概念叫Surrogate key, 中文一般翻譯為"代理關鍵字". 代理關鍵字一般是指維度表中使用順序分配的數值作為主鍵, 也成為"代理鍵", 代理關鍵字用於維度表和事實表的連結. 可以避免通過主鍵的值就可以瞭解一些業務資訊.