逐步深入大資料設計的核心—資料倉庫設計之多維模型設計和標籤設計
阿新 • • 發佈:2022-12-07
步深入大資料設計的核心—資料倉庫設計之多維模型設計和標籤設計。
多維模型設計4步:確定業務場景、宣告粒度、維度設計和事實表設計
大資料分析都是場景驅動,必須先明確場景。
粒度也就是場景中重點關注的實體,一般是原始主鍵或者維度聯合主鍵,粒度設計合理,分析更加方便,架構調整越小。
(從這個意義上來說,OLAP設計是否技術架構是經常變幻的?就像場景是經常變幻的;通常OLTP一般技術架構變動比較少)
維度是看問題的視角,一般是離散的或者有限範圍的,不變的或者不常變的,維度有層級,有屬性,有描述。
事實表就是對粒度和維度的具體度量值,可以匯聚,鑽取,切片分析。
標籤分為事實標籤、規則標籤和模型標籤。
事實標籤感覺和度量是一回事。
規則標籤是維度和度量結合一些判斷規則生成的。
模型標籤是通過屬性+演算法生成的。
——標籤從客觀到主管,靜態到動態,越來越接近自然人的分析與判斷,所謂人工智慧可窺見一斑。
從紛繁複雜的各種概念中做做分類,釐清思路,梳理知識體系,更深入瞭解設計的真諦!