1. 程式人生 > >三級資料庫知識點(十四)

三級資料庫知識點(十四)

人們採用資料抽取程式從OLTP系統中抽取出資料的主要原因是:

  • 抽取程式方面的效能方面的衝突問題,也使使用者可以控制資料
  • 為了解決效能和歷史資料的問題,即在不影響聯機事務處理系統的前提下,實現一些較為複雜的DSS系統或MIS系統的分析應用,人們開始從OLTP系統中抽取資料,再對抽取出的資料進行處理和分析。
  • 抽取程式從檔案或資料庫中查詢有用的資訊,然後再將資料傳送到其他檔案或資料庫中去,供使用者分析處理

資料倉庫

特性 
資料倉庫具有面向主題、整合、不可更新、時間特性四個重要特性

建立資料倉庫的恰當理由

  • 充分利用企業資訊系統生成的資料
  • 解決資料分析應用和企業基本業務應用之間的效能衝突問題
  • 以面向主題、整合的方式合理組織資料,實現跨專業檢視

資料倉庫的資料組織

粒度

  • 一般將綜合級別稱為粒度。粒度越大,表示綜合程度越高;粒度越小,表示綜合程度越低;
  • 粒度影響資料倉庫的資料量以及系統能回答得查詢型別。顯然,粒度越小,細節程度越高,能回答的查詢就越多。但是,因為需要儲存低粒度級的細節資料,資料量就比較大,空間代價也大

操作型資料儲存

  • 設立ODS這個資料儲存層的最初目的是支援一些特殊的應用功能,主要包括即時(up-to-second)OLAP和全域性型OLTP應用

ODS分類

  1. ODSⅠ:第一類ODS資料更新頻率是秒級的;
  2. ODSⅡ:第二類ODS資料更新頻率是小時級的;
  3. ODSⅢ:第三類ODS資料跟新頻率是天級的;
  4. ODSⅣ:第四類ODS是根據資料來源方向和型別區分的;其中資料不僅包含來自操作型環境的資料,也包含由資料倉庫層和資料集市層的應用反饋給ODS的一些決策結果或一些報表資訊。

資料庫維護策略

維護策略

  • 資料庫的維護策略分為三種:實時維護、延時維護和快照維護

OLAP的實現方式

OLAP的是實現方式有三種:基於多維資料庫的OLAP(MOLAP)、基於關係資料庫的OLAP(ROLAP)、混合型的OLAP(HOLAP)

資料探勘

  • 資料探勘作為發現只是的過程:一般由三個階段組成:資料準備、資料探勘、結果的解釋評估

  • 資料整合一般包括