大資料時代來臨 IT如何做好準備
不管你有沒有準備好,大資料時代都將來臨。目前,IT經理需要做好以下5件事來迎接未來的海量資料的挑戰。
By David Linthicum | InfoWorld
你的“大資料”計劃準備就緒了嗎?如果沒有,你可能要開始考慮設計一個了。
現今,大資料作為未來一項關鍵的戰略資產備受推崇或者說過度炒作—這取決於你的個人看法,但這意味著任何一家企業的CEO都想知道IT對大資料的看法並如何迎接挑戰,這只是時間問題而已。
那如何回到CEO們呢?可以肯定的是,對於大多數IT部門來說,處理大量資料已不是一件新鮮事。但拋卻炒作不談,分析家們說,大資料分析確實與以前的資料倉庫、資料探勘和商業智慧(BI)分析有明顯不同之處。
資料正以前所未有的速度大量湧現,與過去產生的資料不同的是,現在產生的大部分資料是非結構化資料和原生資料(有時被稱為“灰色資料“)。
部落格、社交媒體網路、機械感測器和基於位置的資料構成了整個非結構化資料體系。如果能夠迅速捕捉、管理和分析這些資料,就可以幫助企業發現他們過去無法認識到的事實和模式。
“我們已經收集了很長一段時間的資料,但成效有限。因為雖然我們製造了很多資料,但是沒有一個人能夠挖掘這些資料的價值”,電腦科學公司前沿論壇和技術方案主管Paul·Gustafson說:“資料圍繞業務流程來對資料進行歸檔和建模,而不是圍繞為企業提供泛泛的資訊來建模,這種差異是從收集到連線的重大轉變。”
例如,根據麥肯錫全球研究所五月份釋出的報告,美國的醫療保健行業通過有效利用護理、治癒率和服務質量、患者病史等相關資料,可以提高效率並增加生產力。該報告表明,如此大量資料可能會創造每年超過3000億美元的價值;該報告同樣表明,大資料還有可能帶動零售行業平均營業利潤率超過60%的增長。
IT是站在資料革命的最前沿的的人群,行業觀察家如是說:“這是一個新的機會:你可以走進CEO的辦公室,並對他說,我可以改善這塊業務,並在幾秒鐘內提供我在五年前連線觸都接觸不到的資訊。”卡特琳娜市場部CIO 埃裡克·威廉姆斯說。
威廉姆斯應該知道卡特琳娜始終保持著一個高達2.5PB的客戶忠誠度資料庫,其中包括通過最大的連鎖零售企業收集到的超過1.9億美元的零售資料資訊,反過來,可以基於這些資訊中的購買歷史記錄生成優惠券,再促進銷售。
威廉姆斯和其他行業觀察家都認為,引導企業進入到實時預測智慧時代,技術經理必須發展自己的企業資訊化管理架構和文化以支援TB和PB(或者EB和ZB計量的潛力)資料量級的先進的資料儲存分析。
“IT經理們經常說他們想盡辦法來開展大資料業務,因為這是一個驚人的機會。”威廉姆斯說。因此為迎接大資料時代到來,IT需克服阻礙大資料到來的障礙。
早期大資料技術還處於初步發展階段,產品成熟度尚未達到一定水平可以使IT經理們習慣使用專業的軟體工具。
現在許多新興的大資料產品是植根於開源技術的,雖然通過很多商業化渠道都可以得到,但是仍然缺乏成熟的第三方諮詢和支援的外部環境,就像傳統的應用軟體有成熟的服務提供商一樣,如ERP,Gartner研究總監馬庫斯·柯林斯指出。
更重要的是,大多數IT部門到目前為止還僅僅是建設和維護較傳統的、結構化資料倉庫,在大資料技能方面仍有明顯的差距。
在大資料問題成為主要問題之前,公司需要從企業文化和資訊化管理實踐兩方面做出重大轉變,Gartner資訊管理副總裁馬克·拜爾指出。
拜耳和其他分析師認為,精明的IT領導人會從現在開始武裝自己和公司並適時進行重大轉變。
——下面是一位技術經理最應該做的五件事,以迎接未來大資料時代的挑戰。——
盤點你的資料
幾乎每一個組織都可能擁有一個穩定的非結構化資料流,不管是從社交媒體網路還是從感測器監測的工廠車間獲得的。但是,一個組織產生資訊“消防水帶”,並不意味著挖掘這些資訊的價值就是當務之急。
“由於有了大資料的前期炒作,人們都感到一種人為的需要去了解所有部落格或感測器的資料。”Constellation副總裁兼首席分析師Neil·Raden指出。
部分焦慮可能來自急於推動企業計算領域另一次重大變化的供應商和顧問。“有一定的推動力來自於使技術商業化的人”,Raden講道。
精明的IT經理將抵制去“消防水帶”喝水的衝動,儘量避免使IT部門成為為企業篩選與企業相關或不相關資料的過濾器。
面對大量的資料,IT部門首先要做的應該是盤點資料,弄清楚哪些資料是內部產生的,外部資料的來源是什麼。如果IT部門已經開始這樣做,這將會彌補在知識上的差距,並能充分洞察企業業務,Raden說。
一旦資料研究開始進行,IT部門要有很強的針對性,而不是一個泛泛的跟大資料相關的專案。“你不必花費幾百萬美元啟動一個專案來看它是否值得”,Raden說。
讓業務需求驅動資料探勘
這聽起來像破紀錄,但正如海量和多變對大資料來說是其關鍵特點一樣,IT部門的工作和業務需求一致對一項創造才是至關重要的,IT分析師說。
之前大資料裡的許多機遇都為IT部門以外的領域所用,例如,市場部門在早期就深入社交媒體來深入瞭解並挖掘客戶需求和購買趨勢。
即使市場部門甚至整個企業都看到了大資料的帶來的機遇,但是進行資料共享和普及資料整合概念仍然是IT部門的責任。
“這不是IT部門可以獨立完成的任務”,普華永道會計師事務所資訊管理行業主管戴夫·巴頓說,“如果不跟企業的業務目標看齊,這將很難成功”。
在一個早期大資料的專案中,卡塔利娜市場營銷專家威廉姆斯就將企業經營管理者和其財務規劃和分析(FPA)小組匯聚在一起,試圖為企業資訊架構投資提供資料依據。
通過分析實際業務可以識別新概念創造價值的領域所在,例如,根據消費者的購物清單或者基於產品報價的下次購買分析來確定顧客的後續購買行為,FPA小組通過分析這些資料可以將提高生產力或增加銷售額的結果進行量化。
重新評估基礎設施和資料架構
對於大多數公司來說,大資料要求公司的伺服器和儲存基礎設施、資訊管理架構都要進行重大變革,Gartner拜爾和其他專家講到,IT經理應準備好擴大IT平臺,以應對快速擴張的結構化和非結構化資料。
這需要找出一個很好的平臺轉變方式,不僅能使平臺具有可拓展性特點,而且能為整合所有不同系統提供一個發展路徑。
“今天,大多數企業都是不同的、孤立的薪金系統,有的針對客戶管理的,有的是針對營銷的”,IBM大資料產品部門副總裁Anjul·Bhambhri說道,“CIO們真的需要有一個地方能把這些不同的、孤立的系統放到一起,並且建立起相應的系統體系。在該系統體系中你想要問的問題都可以得到解答”。
可以肯定的是,並不是每個系統都要整合,這在很大程度上取決於公司的規模、業務領域和資料需要。但Bhambhri和其他人都認為,首要目標應該是建立一個資訊管理架構,以確保系統之間的資料流暢通。公司應充分利用技術如中介軟體、面向服務架構、業務流程的整合等等建立該資訊管理架構。
在此期間,傳統的資料倉庫架構也受到壓力。Gartner的拜爾說,目前部署的資料倉庫有85%在某些方面不能解決2015年極端的資料管理問題。
即便如此,他說,“我們也並不希望將裝置替換作為考慮之一。”相反,現有的庫可以擴大並適應包括內建資料處理能力。
“過去資料倉庫關注的焦點是儲存內容和儲存地點。新的思維方式是,資料倉庫將是新增的和現有的資料加上資料處理和服務提供的結合體。”拜爾解釋說。
專注於技術研究
伴隨大資料到來的是一系列CIO從未接觸過的新的縮略術語和技術。
諸如Hadoop、MapReduce和NoSQL這類的開源技術越來越受到重視,這些開源技術曾使網際網路巨頭谷歌、Facebook等從大資料中獲利。儘管許多開源技術以多種商業形式提供,但是仍然相當不成熟,還需要具有專業技能的人來繼續開發或者維護。
除了專注於開源技術,IT團隊同樣需要確保他們跟得上大資料領域的科技發展步伐,如資料庫分析、柱狀資料庫和資料倉庫裝置。
為了更好地適應大資料來臨的浪潮,IT管理人員及其員工需要深入研究,至少熟習該領域的新工具。
準備僱傭新員工或再培訓老員工
無論是Hadoop專家還是資料專家,大多數IT組織目前在應對大資料挑戰時都缺乏合適的人才。分析技能或許是最關鍵的,同時這也是目前IT人員的技能差距最大之處。
在一個麥肯錫的調查專案中,僅就美國而言,到2018年數理統計和資料分析專家兩方面的人才缺口分別就會有14萬和19萬,包括廣泛炒作的新興角色“資料科學家”在內。
此外,麥肯錫預計還需要1,500,000位額外的在商業或技術方面有過正規預測分析和數理統計培訓的資料學術經理。
IT部門的管轄下,傳統資料倉庫和BI專業人員將需要再次接受培訓。
除了傳統的資訊管理、分配和資料結構方面的技能,新的大資料專業人員不僅需要精通新的預測分析工具和資料管理平臺,更需要了解語義和數學學科。
“構建之前的資料庫的人不一定是構建未來資料庫的人,”卡特琳娜的威廉姆斯說,“不要小看其複雜性。”
“作為一箇中等規模的企業,使員工時刻跟上不斷變化的外部環境確實是一個挑戰。”為了滿足市場需要,Cowan已經開始正式培訓程式設計師和資料庫分析師以學習先進的分析方法。
IT部門負責人必須勇敢的轉變自己,從而在這場變革中裡脫穎而出。雖然過去最好的高科技領導人可能是資訊管理員和基礎設施工程師的結合,但是未來的IT經理將是資料科學家和業務流程工程師的結合,Gartner的拜爾如是說。
“CIO們一直以來的工作就是基於業務給定的指令來管理基礎設施,他們並不能自己來識別機會,並因此創新性的利用資訊”,他解釋說,“這將是轉型的必要所在”。