1. 程式人生 > >數據倉庫和數據集市的區別

數據倉庫和數據集市的區別

和數 面向 tab 單獨 取數 mon 一個 lar 市場部門

見過很多人搞不清楚數據倉庫和數據集市的區別,下面是我見過的最好的關於“什麽是數據倉庫”的回答:

  “數據倉庫是一種關系數據庫模式,其中保存了來自一個或者多個源數據庫的歷史數據和元數據。數據倉庫的目的是便於將數據的報告和分析匯總到多個層次。”

或者更簡單點:

  “一個存放企業各個領域的數據的單獨且有組織的庫。”

典型的數據倉庫有以下的一些特點:

  ~~涉及多個主題域

  ~~有十分詳細的信息

  ~~集合來自不同數據源的數據

  ~~不一定使用維模型,但提供維模型

另一方面,數據集市(Data Mart)是數據倉庫的一個訪問層,用於從數據倉庫抽取相關的數據給用戶,數據集市是數據倉庫的一個子集,通常面向特定的業務線或者團隊(財政部門有他們自己的數據集市,市場部門有他們自己的數據集市,銷售部門有他們自己的數據集市等等)。

根據Inmon學院對數據倉庫的定義,一個獨立的數據集市是更大的數據倉庫的一個邏輯子集或物理子集,通常是相互獨立的,因為數據模式和模型彼此之間不相同。微軟提出的Tabular模型則使得你可以直接從數據倉庫抽取數據而無需從數據集市抽取數據。

所以,簡單地說,我認為數據倉庫包含多個主題域,數據集市僅僅是多個主題域中的一個。

數據倉庫和數據集市的區別