1. 程式人生 > >第一篇 資料倉庫的技術和發展現狀

第一篇 資料倉庫的技術和發展現狀

資料倉庫的產生和發展
----計算機系統的功能從數值計算擴充套件到資料管理距今已有三十多年了。最初的資料管理形式主要是檔案系統,少量的以資料片段之間增加一些關聯和語義而構成層次型或網狀資料庫,但資料的訪問必須依賴於特定的程式,資料的存取方式是固定的、死板的。到了1969年,E.F.Codd博士發表了他著名的關係資料模型的論文。此後,關係資料庫的出現開創了資料管理的一個新時代。
----二十多年來,大量新技術、新思路湧現出來並被用於關係資料庫系統的開發和實現:客戶/伺服器體系結構、儲存過程、多線索併發核心、非同步I/O、代價優化,等等,這一切足以使得關係資料庫系統的處理能力毫不遜色於傳統封閉的資料庫系統。而關係資料庫在訪問邏輯和應用上所帶來的好處則遠遠不止這些,SQL的使用已成為一個不可阻擋的潮流,加上近些年來計算機硬體的處理能力呈數量級的遞增,關係資料庫最終成為聯機事務處理系統的主宰。整個80年代直到90年代初,聯機事務處理一直是資料庫應用的主流。然而,應用在不斷地進步。當聯機事務處理系統應用到一定階段的時候,企業家們便發現單靠擁有聯機事務處理系統已經不足以獲得市場競爭的優勢,他們需要對其自身業務的運作以及整個市場相關行業的態勢進行分析,而做出有利的決策。這種決策需要對大量的業務資料包括歷史業務資料進行分析才能得到。在如今這樣激烈的市場競爭環境下,這種基於業務資料的決策分析,我們把它稱之為聯機分析處理,比以往任何時候都顯得更為重要。如果說傳統聯機事務處理強調的是更新資料庫--向資料庫中新增資訊,那麼聯機分析處理就是從資料庫中獲取資訊、利用資訊。因此,著名的資料倉庫專家RalphKimball寫道:“我們花了二十多年的時間將資料放入資料庫,如今是該將它們拿出來的時候了。”

----事實上,將大量的業務資料應用於分析和統計原本是一個非常簡單和自然的想法。但在實際的操作中,人們卻發現要獲得有用的資訊並非如想像的那麼容易:第一,所有聯機事務處理強調的是密集的資料更新處理效能和系統的可靠性,並不關心資料查詢的方便與快捷。聯機分析和事務處理對系統的要求不同,同一個資料庫在理論上都難以做到兩全;第二,業務資料往往被存放於分散的異構環境中,不易統一查詢訪問,而且還有大量的歷史資料處於離線狀態,形同虛設;第三,業務資料的模式針對事務處理系統而設計,資料的格式和描述方式並不適合非計算機專業人員進行業務上的分析和統計。因此有人感嘆:20年前查詢不到資料是因為資料太少了,而今天查詢不到資料是因為資料太多了。針對這一問題,人們設想專門為業務的統計分析建立一個數據中心,它的資料從聯機的事務處理系統中來、從異構的外部資料來源來、從離線的歷史業務資料中來……這個資料中心是一個聯機的系統,它是專門為分析統計和決策支援應用服務的,通過它可滿足決策支援和聯機分析應用所要求的一切。這個資料中心就叫做資料倉庫。這個概念在90年代初被提出來,如果需要給資料倉庫一個定義的話,那麼資料倉庫就是一個作為決策支援系統和聯機分析應用資料來源的結構化資料環境。資料倉庫所要研究和解決的問題就是從資料庫中獲取資訊的問題。

----那麼資料倉庫與資料庫(主要指關係資料庫)又是什麼關係呢?回想當初,人們固守封閉式系統是出於對事務處理的偏愛,人們選擇關係資料庫是為了方便地獲得資訊。我們只要翻開C.J.Date博士的經典之作《AnIntroductiontoDatabaseSystems》便會發現:今天資料倉庫所要提供的正是當年關係資料庫要所倡導的。然而,“成也蕭何、敗也蕭何”,由於關係資料庫系統在聯機事務處理應用中獲得的巨大成功,使得人們已不知不覺將它劃歸事務處理的範疇;過多地關注於事務處理能力的提高,使得關係資料庫在面對聯機分析應用時又顯得“老革命遇到新問題”--今天的資料倉庫對關係資料庫的聯機分析能力提出了更高的要求,採用普通關係型資料庫作為資料倉庫在功能和效能上都是不夠的,它們必須有專門的改進。因此,資料倉庫與資料庫的區別不僅僅表現在應用的方法和目的方面,同時也涉及到產品和配置上的不同。

----以辨證的眼光來看,資料倉庫的興起實際上是資料管理的一種迴歸,是螺旋式的上升。今天的資料庫就好比當年的層次資料庫和網型資料庫,它們面向事務處理;今天的資料倉庫就好比是當年的關係資料庫,它針對聯機分析。所不同的是,今天的資料倉庫不必再為聯機事務處理的特性而無謂奔忙,由於技術的專業化,它可更專心於聯機分析領域的發展和探索。

----從廠商的角度看,經過長期發展,聯機事務處理系統的市場至90年代中期出現飽和跡象,其增長速度明顯減慢。這導致各大資料庫廠商的傳統業務增長面臨嚴峻挑戰,尋求新的業務增長點成為他們的當務之急。資料倉庫的興起無疑為資料庫產品創造了巨大的市場,它將成為本世紀末到下世紀初資料庫市場的一個新的增長點。因此,資料倉庫的概念一開始便伴隨著濃烈的市場炒作。對於廣大使用者來說,只有從自身應用需求出發,破除技術和概念的神祕性,避虛就實,密切關注技術發展的方向,方可獲得滿意的產品、解決方案和經濟效益。

----資料倉庫的概念一經出現,就首先被應用於金融、電信、保險等主要傳統資料處理密集型行業。國外許多大型的資料倉庫在1996~1997年建立。那麼,什麼樣的行業最需要和可能建立資料倉庫呢?有兩個基本條件:第一,該行業有較為成熟的聯機事務處理系統,它為資料倉庫提供客觀條件;第二,該行業面臨市場競爭的壓力,它為資料倉庫的建立提供外在的動力。

資料倉庫的關鍵技術
----那麼,資料倉庫都有哪些組成部分和關鍵技術呢?與關係資料庫不同,資料倉庫並沒有嚴格的數學理論基礎,它更偏向於工程。由於資料倉庫的這種工程性,因而在技術上可以根據它的工作過程分為:資料的抽取、儲存和管理、資料的表現以及資料倉庫設計的技術諮詢四個方面。在此,我們將分別討論每一個環節。
----1.資料的抽取

----資料的抽取是資料進入倉庫的入口。由於資料倉庫是一個獨立的資料環境,它需要通過抽取過程將資料從聯機事務處理系統、外部資料來源、離線的資料儲存介質中匯入資料倉庫。資料抽取在技術上主要涉及互連、複製、增量、轉換、排程和監控等幾個方面。資料倉庫的資料並不要求與聯機事務處理系統保持實時的同步,因此資料抽取可以定時進行,但多個抽取操作執行的時間、相互的順序、成敗對資料倉庫中資訊的有效性則至關重要。

----在技術發展上,資料抽取所涉及的單個技術環節都已相對成熟,其中有一些是躲不開程式設計的,但整體的整合度還很不夠。目前市面上所提供的大多是資料抽取工具。這些工具通過使用者選定源資料和目標資料的對應關係,會自動生成資料抽取的程式碼。但抽取工具支援的資料種類是有限的;同時資料抽取過程涉及資料的轉換,它是一個與實際應用密切相關的部分,其複雜性使得不可嵌入使用者程式設計的抽取工具往往不能滿足要求。因此,實際的資料倉庫實施過程中往往不一定使用抽取工具。整個抽取過程能否因工具的使用而納入有效的管理、排程和維護則更為重要。從市場發展來看,以資料抽取、異構互連產品為主項的資料倉庫廠商一般都很有可能被其他擁有資料庫產品的公司吞併。在資料倉庫的世界裡,它們只能成為輔助的角色。

----2.儲存和管理

----資料倉庫的真正關鍵是資料的儲存和管理。資料倉庫的組織管理方式決定了它有別於傳統資料庫的特性,同時也決定了其對外部資料表現形式。要決定採用什麼產品和技術來建立資料倉庫核心,則需要從資料倉庫的技術特點著手分析。

----資料倉庫遇到的第一個問題是對大量資料的儲存和管理。這裡所涉及的資料量比傳統事務處理大得多,且隨時間的推移而累積。從現有技術和產品來看,只有關係資料庫系統能夠擔當此任。關係資料庫經過近30年的發展,在資料儲存和管理方面已經非常成熟,非其他資料管理系統可比。目前不少關係資料庫系統已支援資料分割技術,能夠將一個大的資料庫表分散在多個物理儲存裝置中,進一步增強了系統管理大資料量的擴充套件能力。採用關係資料庫管理數百個GB甚至到TB的資料已是一件平常的事情。一些廠商還專門考慮大資料量的系統備份問題,好在資料倉庫對聯機備份的要求並不高。

----資料倉庫要解決的第二個問題是並行處理。在傳統聯機事務處理應用中,使用者訪問系統的特點是短小而密集;對於一個多處理機系統來說,能夠將使用者的請求進行均衡分擔是關鍵,這便是併發操作。而在資料倉庫系統中,使用者訪問系統的特點是龐大而稀疏,每一個查詢和統計都很複雜,但訪問的頻率並不是很高。此時系統需要有能力將所有的處理機調動起來為這一個複雜的查詢請求服務,將該請求並行處理。因此,並行處理技術在資料倉庫中比以往更加重要。大家可以注意一下,在針對資料倉庫的TPC-D基準測試中,比以往增加了一個單使用者環境的測試,稱為“系統功力”(QppD)。系統的並行處理能力對QppD的值有重要影響。目前,關係資料庫系統在並行處理方面已能做到對查詢語句的分解並行、基於資料分割的並行、以及支援跨平臺多處理機的群集環境和MPP環境,能夠支援多達上百個處理機的硬體系統並保持效能的擴充套件能力。


----資料倉庫的第三個問題是針對決策支援查詢的優化。這個問題主要針對關係資料庫而言,因為其他資料管理環境連基本的通用查詢能力還不完善。在技術上,針對決策支援的優化涉及資料庫系統的索引機制、查詢優化器、連線策略、資料排序和取樣等諸多部分。普通關係資料庫採用B樹類的索引,對於性別、年齡、地區等具有大量重複值的欄位幾乎沒有效果。而擴充的關係資料庫則引入了點陣圖索引的機制,以二進位制位表示欄位的狀態,將查詢過程變為篩選過程,單個計算機的基本操作便可篩選多條記錄。由於資料倉庫中各資料表的資料量往往極不均勻,普通查詢優化器所得出的最佳查詢路徑可能不是最優的。因此,面向決策支援的關係資料庫在查詢優化器上也做了改進,同時根據索引的使用特性增加了多重索引掃描的能力。以關係資料庫建立的資料倉庫在應用時會遇到大量的表間連線操作,而連線操作對於關係資料庫來說是一件耗時的事兒。擴充的關係庫中對連線操作可以做預先的定義,我們稱之為連線索引,使得資料庫在執行查詢時可直接獲取資料而不必實施具體的連線操作。資料倉庫的查詢常常只需要資料庫中的部分記錄,如最大的前50家客戶,等等。普通關係資料庫沒有提供這樣的查詢能力,只好將整個表的記錄進行排序,從而耗費了大量的時間。決策支援的關係資料庫在此做了改進,提供了這一功能。此外,資料倉庫的查詢並不需要像事務處理系統那樣精確,但在大容量資料環境中需要有足夠短的系統相應時間。因此,一些資料庫系統增加了取樣資料的查詢能力,在精確度允許的範圍內,大幅度提高系統查詢效率。總之,將普通關係資料庫改造成適合擔當資料倉庫的伺服器有許多工作可以做,它已成為關係資料庫技術的一個重要研究課題和發展方向。可見,對於決策支援的擴充是傳統關係資料庫進入資料倉庫市場的重要技術措施。

----資料倉庫的第四個問題是支援多維分析的查詢模式,這也是關係資料庫在資料倉庫領域遇到的最嚴峻的挑戰之一。使用者在使用資料倉庫時的訪問方式與傳統關係資料庫有很大的不同。對於資料倉庫的訪問往往不是簡單的表和記錄的查詢,而是基於使用者業務的分析模式,即聯機分析。如附圖所示,它的特點是將資料想像成多維的立方體,使用者的查詢便相當於在其中的部分維(稜)上施加條件,對立方體進行切片、分割,得到的結果則是數值的矩陣或向量,並將其製成圖表或輸入數理統計的演算法。

----關係資料庫本身沒有提供這種多維分析的查詢功能,而且在資料倉庫發展的早期,人們發現採用關係資料庫去實現這種多維查詢模式非常低效、查詢處理的過程也難以自動化。為此,人們提出了多維資料庫的概念。多維資料庫是一種以多維資料儲存形式來組織資料的資料管理系統,它不是關係型資料庫,在使用時需要將資料從關係資料庫中轉載到多維資料庫中方可訪問。採用多維資料庫實現的聯機分析應用我們稱之為MOLAP。多維資料庫在針對小型的多維分析應用有較好的效果,但它缺少關係資料庫所擁有的並行處理及大規模資料管理擴充套件性,因此難以承擔大型資料倉庫應用。這樣的狀態直到“星型模式”在關係資料庫設計中得到廣泛應用才徹底改變。幾年前,資料倉庫專家們發現,關係資料庫若採用“星型模式”來組織資料就能很好地解決多維分析的問題。“星型模式”只不過是資料庫設計中資料表之間的一種關聯形式,它的巧妙之處在於能夠找到一個固定的演算法,將使用者的多維查詢請求轉換成針對該資料模式的標準SQL語句,而且該語句是最優化的。“星型模式”的應用為關係資料庫在資料倉庫領域大開綠燈。採用關係資料庫實現的聯機分析應用稱為ROLAP。目前,大多數廠商提供的資料倉庫解決方案都採用ROLAP。

----在資料倉庫的資料儲存管理領域,從當今的技術發展來看,面向決策支援擴充的並行關係資料庫將是資料倉庫的核心。在市場上,資料庫廠商將成為資料倉庫的中堅力量。

----3.資料的表現

----資料表現是資料倉庫的門面。這是一個工具廠商的天下。它們主要集中在多維分析、數理統計和資料探勘方面。

----多維分析是資料倉庫的重要表現形式,由於MOLAP系統是專用的,因此,關於多維分析領域的工具和產品大多是ROLAP工具。這些產品近兩年來更加註重提供基於Web的前端聯機分析介面,而不僅僅是網上資料的釋出。

----數理統計原本與資料倉庫沒有直接的聯絡,但在實際的應用中,客戶需要通過對資料的統計來驗證他們對某些事物的假設,以進行決策。與數理統計相似,資料探勘與資料倉庫也沒有直接聯絡。而且這個概念在現實中有些含混。資料探勘強調的不僅僅是驗證人們對資料特性的假設,而且它更要主動地尋找並發現蘊藏在資料之中的規律。這聽起來雖然很吸引人,但在實現上卻有很大的出入。市場上許多資料探勘工具其實不過是數理統計的應用。它們並不是真正尋找出資料的規律,而是驗證儘可能多的假設,其中包括許多毫無意義的組合,最後由人來判斷其合理性。因此,在當前的資料倉庫應用中,有效地利用數理統計就已經能夠獲得可觀的效益。

----4.資料倉庫設計的技術諮詢

----在資料倉庫的實施過程中,有一些更為基本的問題需要解答。它們包括:資料倉庫提供哪些部門使用?不同的部門怎樣發揮資料倉庫的決策效益?資料倉庫需要存放哪些資料?這些資料以什麼樣的結構存放?資料從哪裡裝載?裝載的頻率多少為合適?需要購置哪些資料管理的產品和工具來建立資料倉庫?等等。這些問題依賴於特定的資料倉庫系統,屬於技術諮詢的範疇。

----事實上,資料倉庫絕不是簡單的產品堆砌,它是綜合性的解決方案和系統工程。在資料倉庫的實施過程中,技術諮詢服務至關重要,是一個不可缺少的部分,它甚至於比購買產品更為重要。目前,資料倉庫的技術諮詢主要來自資料倉庫軟體產品的供應商和獨立的針對資料倉庫技術的諮詢公司。

主流廠商及產品
----作為資料管理市場的熱點,近年來有很多公司投入資料倉庫市場的角逐。在此,我們將選擇介紹其中一部分廠商。首先,它們是為中國市場所熟悉的,其產品能夠容易買到。其次,我們主要選擇軟體廠商。第三,這些廠商分為兩大類,一類是擁有資料庫產品背景的,它們將是資料倉庫市場的中堅力量;另一類是工具產品廠商,提供資料倉庫解決方案中的外圍工具(在此不多介紹)。
----資料管理類廠商中主要有(字母排序):IBM,Informix,Microsoft,NCR,Oracle,Sybase等。

----■IBM

----作為資料倉庫領域中的一支勁旅,IBM是一家同時擁有硬體和軟體的廠商。在資料倉庫技術領域,IBM最注目的是其SP/2的MPP硬體環境。近年來,它以開放系統管理了大量超過TB容量的資料倉庫。由於封閉的主機系統一時難以成為資料倉庫中心繫統的主流,SP/2等開放的MPP環境必然成為主宰。相比之下,IBM的資料庫軟體表現平常,其資料倉庫核心採用的是DB2UniversalServer(簡稱UDB)的ParallelEdition。IBM的優勢在於業界的聲譽、市場份額、硬體系統和諮詢服務。

----■Informix

----Informix是一家專業的資料庫廠商,其關係資料庫伺服器DynamicServer在傳統聯機事務處理應用中始終佔據著穩定而廣泛的市場份額。近年來,資料倉庫成為該公司重要的發展領域之一。在資料倉庫技術上,Informix主要關注在這麼幾個方面:第一,並行處理的資料庫伺服器。Informix的ExtendedParallelServer(XPS)專為企業級決策支援系統而設計,採用非共享技術支援群集系統和MPP環境,能夠提供近線性的效能擴充套件能力。第二,在並行關係資料庫的基礎上,Informix增加了針對決策支援操作的擴充套件。第三,Informix提供了MetaCubeOLAP中介軟體,以多層客戶/伺服器結構實現ROLAP解決方案,並在其中集成了基於彙總和取樣的查詢優化機制。

----1998年底,著名的資料倉庫供應商RedBrick併入了Informix,增強了它在資料抽取、資料探勘以及在行業顧問諮詢方面的實力。目前,Informix將資料倉庫看成產品和服務的集合,將整體解決方案命名為DecisionFrontier。

----■Microsoft

----微軟是以其關係資料庫SQLServer作為它資料倉庫核心的。在資料倉庫領域,微軟的計劃是將Plato(一個OLAP伺服器)和DataTransformationServices(資料轉換服務,包括資料抽取、轉換和裝載能力)作為其SQLServer7.0資料庫的免費組成部分。微軟的OLAP走的是ROLAP的路子,與其資料轉換一樣,屬於常規的解決方案;而並行處理和決策支援擴充套件則不是SQLServer的強項。因此,整個解決方案仍面向中低端,價格取勝是關鍵。

----為此,微軟在資料倉庫市場中倡導了另一個概念--資料集市(DataMart)。所謂資料集市就是一個面向部門應用的、小型的資料倉庫;所採用的技術與資料倉庫相似,但儲存的內容更加專題化。對於資料集市這樣的規模,微軟的解決方案便可成為理想的選擇。

----■NCR

----NCR是資料倉庫的先驅之一,具有強大的以業務為中心的顧問諮詢力量,在傳統資料倉庫領域有很大的市場。NCR的資料倉庫產品名為TeradataScalableWarehouse,取超大規模資料之意,面向高階資料倉庫市場。NCR的Teradata並非一個開放的資料庫系統,它專為資料倉庫領域而設計的。但在有關資料倉庫效能的TPC-D測試中,Teradata的表現卻很平常,它需要更多的並行處理機。Teradata執行的平臺主要是MPP環境,作業系統也是NCR自己的,直到最近才支援Unix和NT。

----NCR是專注於高階資料倉庫的廠商,其Teradata在大規模系統和資料量下表現良好。但它的解決方案也面臨著挑戰:聯機多維分析是它的弱項。

----■Oracle

----Oracle公司早先在資料倉庫上的研究集中在OLAP多維分析上。數年前,Oracle收購了名為IRI的多維資料庫廠商,推出Express多維資料庫,以MOLAP模式提供了聯機分析的解決方案。隨著近年來ROLAP的解決方案漸漸成為主流,在Oracle最新推出的資料倉庫解決方案--OracleDataMartSuite中Oracle以Oracle8EnterpriseServer為資料倉庫伺服器。

----■Sybase

----早在1994年推廣System10的時候,Sybase便在資料庫的大規模並行聯機備份、資料複製、異構資料庫互連等方面做了大量工作。在核心領域,Sybase專門為MPP環境設計了NavigationServer,與SQLServer配合構成大規模並行處理環境。1995年初,Sybase通過收購ExpressWay,推出了第一個與大型關係資料庫結合的點陣圖索引機制--SybaseIQ。目前,Sybase推出的資料倉庫解決方案名叫SybaseWarehouseStudio,其中有通過SybaseIQ加強的AdaptiveServer,以及Power系列的設計、轉換、OLAP工具。但在實際的應用解決方案中,由於市場的原因,Sybase往往需要借用第三方的工具。

資料倉庫未來發展方向
----資料倉庫是資料管理技術和市場上一個方興未艾的領域,有著良好的發展前景。在此,我們將從技術、應用、市場等幾個方面探討資料倉庫的未來發展。
----資料倉庫技術的發展自然包括資料抽取、儲存管理、資料表現和方法論等方面。在資料抽取方面,未來的技術發展將集中在系統整合化方面。它將互連、轉換、複製、排程、監控納入標準化的統一管理,以適應資料倉庫本身或資料來源可能的變化,使系統更便於管理和維護。在資料管理方面,未來的發展將使資料庫廠商明確推出資料倉庫引擎,作為伺服器產品與資料庫伺服器並駕齊驅。在這一方面,帶有決策支援擴充套件的並行關係資料庫將最具發展潛力。在資料表現方面,數理統計的演算法和功能將普遍整合到聯機分析產品中,同時與Internet/Web技術緊密結合,推出適用於Intranet、終端免維護的資料倉庫訪問前端。在這個方面,按行業應用特徵細化的資料倉庫使用者前端軟體將成為產品作為資料倉庫解決方案的一部分。資料倉庫實現過程的方法論將更加普及,將成為資料庫設計的一個明確分支,成為管理資訊系統設計的必備。


----計算機應用發展的資料倉庫傾向是資料倉庫發展的推動力。傳統的聯機事務處理系統並不單獨考慮資料倉庫,但實際應用對資料倉庫所能提供的功能卻早有需求。因此,許多事務處理系統近年來陷入一個兩難的境地:在現有系統上增加有限的聯機分析功能,包括複雜的報表和資料彙總操作;一方面嚴重影響了事務處理聯機效能,另一方面統計分析又因系統結構上的種種限制而不能充分體現。其結果是:應用技術的發展是朝著更加細化,更加專業的方向。在新一代的應用系統中,資料倉庫在一開始便被納入系統設計的考慮,聯機分析應用於普遍的事務處理系統之中。在資料管理上,聯機事務處理和資料倉庫在應用中相對獨立,使聯機事務處理系統本身更加簡潔高效,同時分析統計也更為便利。面向行業的數理統計學向更為普遍的應用發展,並整合到應用系統的資料倉庫解決方案中。它們將立足於資料倉庫提供的豐富資訊,更好地為業務決策服務。

----在市場上,我們將從廠商和使用者兩個方面看資料倉庫的發展。對於提供資料倉庫產品和解決方案的廠商來說,嚴酷的市場競爭是永恆的主題。未來的發展將是不提供完整解決方案的廠商可能被其他公司收購,例如從事資料抽取、提供專用工具的軟體公司很可能併入大型資料庫廠商而去構建完整的解決方案。能夠持續發展的廠商大致有兩類:一是擁有強大的資料庫、資料管理背景的公司;二是專門提供面向具體行業的、關於資料倉庫實施的技術諮詢的公司。

----從使用者的角度看,資料管理的傳統領域,如金融、保險、電信等行業中的特定應用,如信用分析、風險分析、欺詐檢測等,是資料倉庫的主要市場之外,資料倉庫的應用隨著現代社會商業模式的變革而進一步普及和深入。近年來,一場悄悄的革命正在改變產品製造和提供服務的方式,它就是數字化定製經濟模式。在這個世界裡,使用者可以購買一臺根據自己要求組裝的計算機、一條根據自己體形設計的牛仔褲、一種根據自己身體需要而生產的保健藥、一副與自己臉型相配的眼鏡……,大規模的定製不僅是一種製造過程、後勤系統、或者推銷策略,它很可能成為下一世紀企業生產的組織原則,就像成批生產是本世紀的組織原則一樣。在未來大規模定製經濟環境下,資料倉庫將成為企業獲得競爭優勢的關鍵武器。

----總之,資料倉庫是一項基於資料管理和利用的綜合性技術和解決方案,它將成為資料庫市場的新一輪增長點,同時也成為下一代應用系統的重要組成部分。資料倉庫對於廣大計算機使用者,包括中國使用者,並不遙遠;它看得見、摸得著、買得到。資料倉庫技術其實也不神祕,至少比絕大多數統計學定理來得簡單。相信大家必能在資料倉庫的實施和使用中獲得滿意的效果。