1. 程式人生 > >資料立方體基本概念

資料立方體基本概念

    先說一下,昨天本來寫了一遍了,但是繫結QQ時不知道怎麼弄得,寫的沒有了。所以重新寫一遍。

我以上傳的那張圖片為例。這是有ABC維和度量M構成的3-D資料立方體。其中的all是泛化程度最高的點。

基本單元:基本方體的單元稱之為基本單元。

聚集單元:非基本方體的單元稱為聚集單元。

關於祖先和後代的概念,我們看下面這個例子

例:一個數據立方體A=(mouth,city,gender,measure(度量)),其中a=(1,×,×,10),b=(1,harbin,×,20),c=(1,harbin,male,30),這裡的a是1-D單元,b是2-D單元,c是3-D單元。這個方體中所有的基本單元是3-D單元。1-D單元和2-D單元都是聚集單元。其中a是b和c的祖先,c是b的子女,c是a的後代。

完全立方體:資料立方體的所有基本方體的所有單元

稀疏方體:一個方體中維的基數乘積很大時(相對於存放在方體中非零值元組的數量),稱這個方體是稀疏的。

冰山立方體:滿足最小支援度閾值的部分物化的方體。我們稱這部分物化的方體為冰山立方體。