三級資料庫知識點(十四)
阿新 • • 發佈:2019-01-27
人們採用資料抽取程式從OLTP系統中抽取出資料的主要原因是:
- 抽取程式方面的效能方面的衝突問題,也使使用者可以控制資料
- 為了解決效能和歷史資料的問題,即在不影響聯機事務處理系統的前提下,實現一些較為複雜的DSS系統或MIS系統的分析應用,人們開始從OLTP系統中抽取資料,再對抽取出的資料進行處理和分析。
- 抽取程式從檔案或資料庫中查詢有用的資訊,然後再將資料傳送到其他檔案或資料庫中去,供使用者分析處理
資料倉庫
特性
資料倉庫具有面向主題、整合、不可更新、時間特性四個重要特性
建立資料倉庫的恰當理由
- 充分利用企業資訊系統生成的資料
- 解決資料分析應用和企業基本業務應用之間的效能衝突問題
- 以面向主題、整合的方式合理組織資料,實現跨專業檢視
資料倉庫的資料組織
粒度
- 一般將綜合級別稱為粒度。粒度越大,表示綜合程度越高;粒度越小,表示綜合程度越低;
- 粒度影響資料倉庫的資料量以及系統能回答得查詢型別。顯然,粒度越小,細節程度越高,能回答的查詢就越多。但是,因為需要儲存低粒度級的細節資料,資料量就比較大,空間代價也大
操作型資料儲存
- 設立ODS這個資料儲存層的最初目的是支援一些特殊的應用功能,主要包括即時(up-to-second)OLAP和全域性型OLTP應用
ODS分類
- ODSⅠ:第一類ODS資料更新頻率是秒級的;
- ODSⅡ:第二類ODS資料更新頻率是小時級的;
- ODSⅢ:第三類ODS資料跟新頻率是天級的;
- ODSⅣ:第四類ODS是根據資料來源方向和型別區分的;其中資料不僅包含來自操作型環境的資料,也包含由資料倉庫層和資料集市層的應用反饋給ODS的一些決策結果或一些報表資訊。
資料庫維護策略
維護策略
- 資料庫的維護策略分為三種:實時維護、延時維護和快照維護
OLAP的實現方式
OLAP的是實現方式有三種:基於多維資料庫的OLAP(MOLAP)、基於關係資料庫的OLAP(ROLAP)、混合型的OLAP(HOLAP)
資料探勘
-
資料探勘作為發現只是的過程:一般由三個階段組成:資料準備、資料探勘、結果的解釋評估
-
資料整合一般包括