1. 程式人生 > >資料倉庫之父——Bill Inmon(轉載)

資料倉庫之父——Bill Inmon(轉載)

比爾·恩門(Bill Inmon),被稱為資料倉庫之父,最早的資料倉庫概念提出者,在資料庫技術管理與資料庫設計方面,擁有逾35年的經驗。他是“企業資訊工廠”的合作創始人與“政府資訊工廠”的創始人。

  比爾·恩門的思想與見識在所有重量級的計算機協會、許多產業會議、技術研討會上,都博得了無比的敬重。他寫過650多篇文章,大多釋出在世界最知名的IT刊物裡,DMReview雜誌每期都有恩門先生的專欄文章,他寫了46本書籍,最著名的要數“Building the Data Warehouse”(《建立資料倉庫》),這本資料倉庫精典讀物倍受讀者喜愛,一而再在而三地升級出版發行,到目前已經是第三版本,發行量達50多萬冊。也正是這本《建立資料倉庫》為恩門贏得“資料倉庫之父”的殊榮,國內機械工業出版社也分別將第2第3版本引進翻譯,恩門先生的著作也一直是亞馬遜電子商務網站的暢銷書,都深受廣大資料倉庫技術讀者喜歡。同時恩門又是最知名的資料倉庫諮詢顧問專家,他為許多名列《財富》1000排行榜的公司提供過資料倉庫設計和資料庫管理方面的諮詢服務。恩門這些年還創立過公司辦過網上教育,1995建立了現在的Ambeo公司。

  恩門先生在上世紀80年代,其《建立資料倉庫》一書中定義了資料倉庫的概念,隨後又給出了更為精確的定義:資料倉庫是在企業管理和決策中面向主題的、整合的、與時間相關的、不可修改的資料集合。與其他資料庫應用不同的是,資料倉庫更像一種過程,對分佈在企業內部各處的業務資料的整合、加工和分析的過程。而不是一種可以購買的產品。正是他當初對資料倉庫的這個定義,已成為了業界引用最多、說得最廣的名言,每一個啟蒙的資料倉庫學習者都是從這一句名言開始的。

比爾·恩門的對頭 
  隨著拉爾夫·金博爾(Ralph Kimball)博士出版了他的第一本書“The DataWarehouse Toolkit”(《資料倉庫工具箱》),資料倉庫行業就開始喧譁起來,恩門的“Building the Data Warehouse”主張建立資料倉庫時採用自上而下(DWDM)方式,以第3正規化進行資料倉庫模型設計,而他生活上的好朋友Ralph Kimball在“The DataWarehouse Toolkit”則是主張自下而上(DMDW)的方式,力推資料集市建設,以致他們的FANS吵鬧得差點打了起來,直至恩門推出新的BI架構CIF(Corporation information factory),把Kimball的資料集市包括了進來才算平息。

  在過去的15年中,Ralph Kimball和Bill Inmon一直是商業智慧領域中的革新者,開發並測試了新的技術和體系結構。他們都撰寫了關於資料倉庫的多本書籍,這些書也經常被參考。Kimball 和 Inmon 都同意組織需要一個與遺留系統和聯機事務處理(OLTP)系統分開的資料倉庫,以捕獲組織的有關資訊並且使之可用。他們也同意資料倉庫中的資料應該是淨化的、一致的,並且不受到其來源的遺留系統和 OLTP 系統設計的牽制。

  在開始第一個資料集市之前,他們還同意用針對整個體系結構的思想重複構建資料倉庫。到這裡,他們的意見就發生了分歧。Bill Inmon將資料倉庫定義為“一個面向主題的、整合的、隨時間變化的、非易變的用於支援管理的決策過程的資料集合”(Building the data warehouse,第 2 版,第 33 頁)。Inmon通過“面向主題”表示應該圍繞主題來組織資料倉庫中的資料,例如客戶、供應商、產品等等。

  每個主題區域僅僅包含該主題相關的資訊。資料倉庫應該一次增加一個主題,並且當需要容易地訪問多個主題時,應該建立以資料倉庫為來源的資料集市。換言之,某個特定資料集市中的所有資料都應該來自於面向主題的資料儲存。Inmon 的方法包含了更多上述工作而減少了對於資訊的初始訪問。但他認為這個集中式的體系結構持續下去將提供更強的一致性和靈活性,並且從長遠來看將真正節省資源和工作。

      Ralph Kimball說“資料倉庫僅僅是構成它的資料集市的聯合”(Figure 2,The Data Warehouse Lifecycle Toolkit,第 27 頁)。他認為“可以通過一系列維數相同的資料集市遞增地構建資料倉庫”。每個資料集市將聯合多個數據源來滿足特定的業務需求。通過使用“一致的”維,能夠共同看到不同資料集市中的資訊,這表示它們擁有公共定義的元素。Kimball的方法將提供整合的資料來回答組織迫切的業務問題並且要快於Inmon的方法。Inmon的方法是隻有在構建幾個單主題區域之後,集中式的資料倉庫才建立資料集市。而Kimball認為該方法缺乏靈活性並且在現在的商業環境中所花時間太長。

  從Inmon被人尊稱為資料倉庫之父,就可以看出,inmon對於資料倉庫領域的技術發展作起的作用的巨大的,無數資料倉庫愛好者甚至把《建設資料倉庫》看作是資料倉庫的“聖經”。inmon自己建立的網站上的文章被廣為傳頌,每當有inmon公開演講的時候,很多使用者和技術人員都把能夠聆聽inmon的最新成果為榮。在企業資訊工廠的設計藍圖中,inmon清除地描述瞭如何從各種業務系統當中捕獲需要的資料,並在隨後的流程中,為適應不同的需求,而逐漸演變為各種不同的形態,所有的這一切都圍繞著一個最重要的部件來運轉,這就是企業資料倉庫。

  在國內資料倉庫領域,inmon和kimball的理論也一度爭論不休,但是隨著資料倉庫建設的逐步深化,把企業資料倉庫作為企業資料整合平臺的思路深得人心,越來越多的企業開始強調在企業內部建立一個企業級別的資料倉庫來支援整個企業的發展和運作。

比爾·恩門的重點著作 
  以下列出恩門的幾本重點著作:

  1、“Building the Data Warehouse ”(《建立資料倉庫》)

  2、“Corporation information factory”(《企業資訊工廠》)

  3、“Govment information factory”《政府資訊工廠》

  4、“The Data Model Resource Book: A Library of Logical Data and Data Warehouse Designs”(《資料倉庫建模》)

  5、“Managing the Data Warehouse”(《資料倉庫管理》)

  6、“Data Warehousing for E-Business”(《電子商務中的資料倉庫技術》