第四章 結構化資料分析
阿新 • • 發佈:2022-03-26
1. 結構化資料分析及OLAP相關概念
(1) 資料倉庫
資料庫 經抽取,轉換和裝載 建立資料倉庫
(2) OLAP 聯機事務處理
簡單分析與複雜分析
(3) 操作型與分析型
(4) 資料倉庫的特點
面向主題,整合的,非易失的,時變的
(5) 星型模型
事實表與維表(分類資訊)
如美國的 SSB資料倉庫標準
(6) 從二維表到三,四維表
(7) 聯機分析處理的主要操作
上卷,下鑽,切片,切塊,旋轉
(8) 資料儲存的基本方式
a. 多維陣列
b. 關係資料庫
c. 混合儲存
2. 高效能OLAP系統的關鍵技術
(1) 儲存方式
行儲存,列儲存,基於行與列的查詢操作,點陣圖索引技術(按塊儲存Bitmap)
(2) 優化技術
索引,查詢,併發,恢復
共享記憶體技術,共享磁碟技術
資料劃分技術(list, range, hash)
3. 結構化資料分析技術
(1) Hadoop技術 架構不同,具體細節在後續深入課程中講解
(2) Teradata技術
(3) SAP HANA技術
(4) MonetDB, Vectorwise, VectorH
(5) SQL ON Hadoop系統