1. 程式人生 > 其它 >數倉主題和主題域

數倉主題和主題域

1.數倉主題是什麼?

數倉主題(Subject)是在較高層次上將企業資訊系統中某一分析物件(重點是分析的物件)的資料進行整合、歸類並分析的一種範圍,屬於一個抽象概念,簡單點說每一個主題對應一個巨集觀分析領域。

下面舉例說明一下:對於一個erp系統而言,“銷售分析”就是一個分析領域,這個“銷售分析”所涉及到的分析物件有商品、供應商、顧客、倉庫等,那麼數倉主題就確定為商品主題、供應商主題、顧客主題、倉庫主題,“銷售分析”就可以作為一個主題域;

如果“產品分析”是一個分析領域,“產品分析”所涉及到的分析物件為商品、地域、時間、類別等,那麼數倉的主題可以確定為商品主題、地域主題、時間主題、類別主題,“產品分析”可以作為一個主題域。

2.數倉主題域是什麼呢?

主題域通常是聯絡較為緊密的資料主題的集合,可以根據業務的關注點,將這些資料主題劃分到不同的主題域,這種劃分個人感覺與Kimball思想更為相似,自下而上的方式,根據業務需求分析視角進行劃分。

其實這裡市面上,也有一些不同的描述,上面對主題域的描述被歸於集合論,還有一種叫做是邊界論,這裡稍微擴充套件下:

邊界論的論點是“主題域是對某個主題進行分析後確定的主題的邊界“,這點個人感覺和 Inmon 指導思想類似,理清主題之間的邊界,由ER模型進行邏輯轉化,對某一主題域的分析,需要先確定這個主題的關係邊界,然後再進行邏輯建模。

我的話覺得兩者並不矛盾,只是所站的視角不同,邊界論是先從細微處也就是微觀延伸到巨集觀,而集合論則是從巨集觀到微觀的過程。

2.主題和主題域的關係

可以顯而易見地看出,主題域是一個更大的概念,主題是略次之,實體最小,這裡的實體表示的是實體物件(對應企業中某一巨集觀分析領域所涉及的分析物件),我的理解在維度建模的方法論上也可以說實體和維度某些概念是相似的。

作者:蘇su 出處:https://www.cnblogs.com/suheng01/ 本文版權歸作者和部落格園共有,歡迎轉載,但未經作者同意必須保留此段宣告,且在文章頁面明顯位置給出原文連線,否則保留追究法律責任的權利.