2017.06.29數據挖掘基礎概念第四章
第四章
39、為什麽在進行聯機分析處理(OLAP)時,我們需要一個獨立的數據倉庫,而不是直接在日常操作的數據庫上進行
1、提高兩個系統的性能 2、操作數據庫支持多事務的並發處理,需要並發控制和恢復機制,確保一致性和事務的魯棒性
3、兩者有著不同的數據的結構、內容和用法
40、什麽是數據倉庫
數據倉庫是一種數據庫,它與單位的操作數據庫分別維護,數據倉庫系統允許將各種應用系統集成在一起,為統一的歷史數據分析提供堅實的平臺,對信息處理提供支持,是一個面向主題的、集成的、時變得、非易失的數據集合,支持管理者的決策過程。
41、數據倉庫的構建需要
1、數據集成 2、數據清理 3、數據統一
42、單位如何使用數據倉庫的信息
1、提高顧客關註度,這包括顧客購買模式
2、根據按季度、按年、按地區的營銷情況比較,重新配置產品和管理產品的投資,調整生產策略。
3、分析運作情況並找出利潤源
4、管理客戶聯系,進行環境調整,管理公司的資產開銷
43、OLTP(聯機事務處理)和OLAP(聯機分析處理)的主要區別
1、用戶和系統的面向性:OLTP是面向顧客的 OLAP面向市場的
2、數據內容:OLTP系統管理當前數據 OLAP系統管理大量的歷史數據
3、數據庫設計:OLTP采用實體-聯系數據模型和面向應用的數據庫設計 OLAP通常采
用星形或雪花模型和面向主題的數據庫設計
4、視圖:OLTP系統主要關註一個企業或部門內部的當前數據,而不涉及歷史數據或不
同單位的數據 OLAP系統處理來自不同單位的信息,以及多個數據庫集成的信息。
5、 訪問模式:OLTP系統的訪問主要由短的原子事務組成,OLAP系統的訪問大部分是只讀操作
44、數據倉庫的三層體系結構
1、底層是倉庫數據庫服務器 2、中間層是OLAP服務器 3、頂層是前端客戶層
45、數據倉庫模型
1、企業倉庫:企業倉庫搜集了關於主題的所有信息,跨越整個企業
2、數據集市:數據集市包含企業範圍數據的子集,對特定的用戶群是有用的
3、虛擬倉庫:操作數據庫上視圖的集合
46、數據倉庫開發的自頂向下和自底向上的優缺點是什麽?
自頂向下開發企業倉庫是一種系統的解決方案,並能最大限度地減少集成問題。然而,它費用高,開發周期長,並且缺乏靈活性,因為整個組織就共同數據模型達成一致時比較困難的。設計、開發、配置獨立的數據集市的自底向上的方法提供了靈活性、低花費,並能快速回報投資。然而,將分散的數據集市集成,形成一個一致的企業數據倉庫時,可能導致問題。
47、數據倉庫系統使用工具和程序的功能
1、數據提取 2、數據清理 3、數據變換 4、裝入 5、刷新
48、元數據庫包括的內容:
1、數據倉庫結構描述 2、操作元數據 3、用於匯總的算法
4、由操作環境到數據倉庫的映射 5、關於系統性能的數據 6、商務元數據
49、在OLAP中,如何使用概念分層
在多維數據模型中,數據組織在多維空間,每維包含由概念分層定義的多個抽象層。這種組織為用戶從不同角度觀察數據提供了靈活性
50、典型的OLAP操作方法
1、上卷 2、下鉆 3、切片和切塊
4、轉軸 5、其他OLAP操作 6、OLAP系統與統計數據庫
2017.06.29數據挖掘基礎概念第四章