1. 程式人生 > >OLAP over Probabilistic Data Cubes I: Aggregating, Materializing, and Querying報告

OLAP over Probabilistic Data Cubes I: Aggregating, Materializing, and Querying報告

OLAP可以通過把大量實體的不同方面資料聚集,而產生有影響力的查詢。但很多資料來源比如GPS,感測器,等其他裝置的資料是不完善的,所以OLAP無法應用。於是,我們提出了一種解決資料真實性的方法-----probabilistic data cubes(資料立方體)。

probabilistic data cubes組成方式

Such a cube is comprised of a set of probabilistic cuboids which summarize the aggregated values in the form of probability mass functions (pmfs in short) and thus offer insights into the underlying data quality and enable confidence-aware query evaluation and analysis.

這種資料立方體是由一系列總結(通過函式而聚集的值)的cuboids(立方塊)組成的,所以這種資料立方體能洞察資料深處,使查詢評估和分析更加清楚。

probabilistic data cube特點

我們通過使資料立方塊(cuboids)聚集,然後使資料立方體(cubes)具體化,達到查詢評估。

在聚集方面,我們關注使立方塊(cuboids)之間的共享模組最大化。使用了兩種方式

i)convolution(卷積),使處理多項式的時間複雜度規模化下降

ii)sketch-based,使處理線性方程式的時間複雜度規模化下降

這兩種方式都支援完整或部分的資料塊(cuboids)的具體化

我們還提供了使資料立方體分片或分塊的演算法