1. 程式人生 > >數據庫與數據倉庫的比較Hbase——Hive

數據庫與數據倉庫的比較Hbase——Hive

歷史數據 發展歷程 數據庫設計 分析 管理 hive eve volatile subject

數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrate)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用於支持管理決策。

(1) 面向主題:指數據倉庫中的數據是按照一定的主題域進行組織。

(2)集成:指對原有分散的數據庫數據經過系統加工, 整理得到的消除源數據中的不一致性。

(3)相對穩定:指一旦某個數據進入數據倉庫以後只需要定期的加載、刷新。

(4)反映歷史變化:指通過這些信息,對企業的發展歷程和未來趨勢做出定量分析預測。

主要區別在於:

(1)數據庫是面向事務的設計,數據倉庫是面向主題設計的。

(2)數據庫一般存儲在線交易數據,數據倉庫存儲的一般是歷史數據。

(3)數據庫設計是盡量避免冗余,數據倉庫在設計是有意引入冗余。

(4)數據庫是為捕獲數據而設計,數據倉庫是為分析數據而設計。

數據庫與數據倉庫的比較Hbase——Hive