Gartner:大資料和BI商業智慧的差別和影響
之所以要區分大資料應用與BI(商業智慧),是因為大資料應用與BI、資料探勘等,並沒有一個相對完整的認知。
BI(BusinessIntelligence)即商務智慧,它是一套完整的解決方案,用來將企業中現有的資料進行有效的整合,快速準確的提供報表並提出決策依據,幫助企業做出明智的業務經營決策。
伴隨著BI的發展,是ETL,資料整合平臺等概念的提出。ETL,Extraction Transformation Loading,資料提取、轉換和載入,資料整合平臺主要功能對各種業務資料進行抽取和相關轉化,以此來滿足BI、資料倉庫對資料格式和內容挖掘的要求。
資料整合平臺的基礎工作與ETL有很大的相似性,其主要功能是實現不同系統不同格式資料地抽取,並且按照目標需求轉化成為相應的格式。資料整合開始是點對點的,慢慢地發現這種模式對於系統之間,不同所有權的企業資料流向以及資料標準控制很難,為此,誕生了對統一企業資料平臺的需求,來實現企業級之間的資料互動。
資料整合平臺就像網路中Hub,可以連線所有應用系統,實現系統之間資料的互通有無。資料整合平臺以BI、資料倉庫需求而產生,現在已經跨越了最初的需求,上升到了一個更高的階段。
如今大資料應用更多關注非結構化資料,更多談論網際網路,Twitter、Facebook、部落格等非結構化資料,如此理解大資料應用,顯然就有些走偏了。結構化資料也屬於大資料,且呈現出相同的特點和特徵,如資料量大,增長越來越快,對資料處理要求高等。
結構化資料是廣義大資料中含金量或者價值密度最高的一部分資料,與之相比,非結構化資料含金量高但價值密度低。在Hadoop平臺出現之前,沒有人談論大資料。資料應用主要是結構化資料,多采用IBM、HP等老牌廠商的小型機或伺服器裝置。
採用傳統方法處理這些價值密度低的非結構化資料,被認為是不值得的,因為其產出實在是有限。Hadoop平臺出現之後,提供了一種開放的、廉價的、基於普通商業硬體的平臺,其核心是分散式大規模並行處理,從而為非結構化資料處理創造條件。
大資料應用的資料來源應該包括結構化資料,如各種資料庫、各種結構化檔案、訊息佇列和應用系統資料等,其次才是非結構化資料,又可以進一步細分為兩部分,一是社交媒體,如Twitter、Facebook、部落格等產生的資料,包括使用者點選的習慣/特點,發表的評論,評論的特點,網民之間的關係等,這些都構成了大資料來源。另外一部分資料,也是資料量比較大的資料,就是機器裝置以及感測器所產生的資料。以電信行業為例,CDR、呼叫記錄,這些資料都屬於原始感測器資料,主要來自路由器或者基站。此外,手機的置感測器,各種手持裝置、門禁系統,攝像頭、ATM機等,其資料量也非常巨大。
對於分析大資料的工具,目前所有的分析工具都側重於結構化分析,例如針對社交媒體評論方向的分析,根據特定的詞頻或者語義,通過統計正面/負面評論的比例,來確定評論性質。如果有一個應用系統是接收結構化資料的,例如一個分析系統,接收這些語義就可以便於分析。
讓大資料應用落地,其中的關鍵在於與行業應用的深度融合。
公安行業的視訊影像處理是一個特定應用領域,傳統BI、ETL工具拿這些資料沒有辦法,採用分散式Hadoop進行處理能夠帶來很好的效益,因為Hadoop可以處理資料量足夠大。公安行業實際上已採集了大量視訊影像資料,利用這些資料,可以追蹤一個嫌疑犯的行蹤,什麼時間在全國哪些地區出現過。這些應用不可能單純依靠人的力量,需要藉助人臉識別、影象識別技術、模式處理,資料壓縮等技術,需要海量處理軟體,抓出相關特徵,幫助公安人員提高工作效率。
在電信行業,計費系統實際上是對各種資料進行整合後的結果,是一個縮小的資料。藉助大資料應用,運營商可以原始大資料進行分析,例如分析感測器資料是否有異常,從而判斷裝置異常等,這些都是一些用傳統BI工具無法實現的分析,其結果往往會出乎意料,幫助運營商提高服務水平以及使用者的滿意度。
在網際網路行業,通過分析手機上網軌跡,可以分析瞭解客戶群,瞭解使用者的偏好,此外,獲取地理位置的資訊,也具有特定價值。
從這些行業大資料應用分析來看,一個是視訊影像處理,一個是日誌分析,另外一個是處理特定檔案格式的分析處理,彼此之間顯然沒有任何通用性的特點,其共同點就是利用了廉價的大資料處理平臺。
Gartner:大資料宣傳在商務智慧市場成效不明顯
市場研究公司Gartner指出,去年的大資料宣傳未能促進全球商務智慧和分析市場出現快速增長。
Gartner稱,儘管商務智慧和分析市場在2013年增長了8%,增長至144億美元,但是漲幅低於預期。大資料通常指對來自社交網路、感測器等來源的海量非結構化資訊進行的挖掘與分析,而傳統的商務智慧只是報告和分析結構化資料儲存。
Gartner 分析師Dan Sommer和Bhavish Sood在報告寫道: “雖然大資料宣傳力度在2013年達到了高潮,但是對分析市場的影響卻不是很大。”報告稱,在Gartner調研的機構中,僅8%的機構實際部署了大資料專案,57%的機構仍處於調研和規劃階段。這一水平已經影響到了大量企業的創新週期。
大資料巨頭在2013年的營利與增長速度之間出現了脫節。SAP、甲骨文、IBM和賽仕研究所等四大商務智慧公司的增長率嚴重低於市場平均增長率。這些廠商面臨的核心挑戰是他們的成熟程度。“他們的核心解決方案一直是IT主導的企業商務智慧平臺,並通過語義層將資訊與報告、查詢與線上分析處理等功能連線在一起。儘管價值昂貴,但是大多數機構部署的均為這種型別的商務智慧解決方案。”
為此類工具提升了低成本備選方案的Jaspersoft和Pentaho等公司在去年獲得了快速增長,其增長率高於市場平均增長率。Gartner的報告指出,Tibco Spotfire和Tableau等公司在2013年推出的資料發現工具對於商務智慧終端使用者體驗來說可以說是一種全新的標準。這些工具讓使用者對資料集有了更多的視覺感受。
分析師指出,大型商務智慧廠商去年一直在不遺餘力的開發自己的資料發現產品。這一舉措將整個市場的競爭推出到了一個更激烈的階段。基於雲的商務智慧在去年開始受到關注。儘管其僅佔有4%的市場份額,但是其增長率達到了42%。“尤其是小型公司已經開始向雲遷移,並將其視為一種可以處於有關大資料和分析等事務的使能器。”
相關推薦
Gartner:大資料和BI商業智慧的差別和影響
之所以要區分大資料應用與BI(商業智慧),是因為大資料應用與BI、資料探勘等,並沒有一個相對完整的認知。 BI(BusinessIntelligence)即商務智慧,它是一套完整的解決方案,用來將企業中現有的資料進行有效的整合,快速準確的提供報表並提出決策依據,幫助
讀書印記 - 《智慧時代:大資料和智慧革命重新定義未來》
這本書所謂的智慧,主要是指依靠資料尤其是大資料實現的智慧,所以關於大資料方面佔主要篇幅而我非想象中的智慧方面,書名難說非常合理。不過現在人工智慧的主要突破來自資料驅動方向,這可能也確實是事實。書裡提到的一些小故事很有趣。搜尋引擎演化到現在,“點選資料……在搜尋排序中佔70%-80%的權重”“如果一家公司能夠在
大資料視覺化BI商業智慧系統開發
大資料時代,人們對資料的整理分析越來越重視,傳統的文字資料龐大,難以快速做出分析。而大資料視覺化BI商業智慧系統可以解決這個問題。資料視覺化,顧名思義是指將海量晦澀的資料通過可視的、互動的方式進行展示,從而形象直觀地表達資料蘊含的資訊和規律。 任何行業可以說都是需要大資料視覺化BI系統的,大資料分析在這個時
譚安林:大資料在智慧外呼系統的應用
歡迎大家前往騰訊雲+社群,獲取更多騰訊海量技術實踐乾貨哦~ 譚安林,騰訊高階工程師,2015年加入騰訊,8年網際網路從業經歷,從事大資料平臺與產品開發相關工作;先後參與廣告、金融等領域產品專案,目前負責行為預測解決方案,幫助客戶盤活現有客群、挖掘潛在高價值新客。目前我們的產品包括:智慧客服、大資料套件、騰
價格操控:大資料“殺熟”和演算法合謀
2017年12月,一名中國網友在微博上講述了自己遭遇大資料“宰客”的經歷。他經常通過某旅行網站預訂某酒店的房間,價格常年為380~400元。偶然一次,酒店前臺告訴他淡季價格為300元上下。他用朋友的賬號查詢後發現,果然是300元,但用自己的賬號去查,還是380
什麼是BI?商業智慧戰略和解決方案
商業智慧(BI)利用軟體和服務將資料轉換為可操作的情報,從而為組織的戰略和戰術業務決策提供資訊。BI工具訪問和分析資料集,並在報告,摘要,儀表板,圖形,圖表和地圖中顯示分析結果,為使用者提供有關業務狀態的詳細資訊。 BI與BA有何
計算晶片:大資料和人工智慧的基石
計算晶片:大資料和人工智慧的基石 大資料推動資訊通訊產業邁入“新摩爾定律”時代。近年來,資訊通訊技術產業加速向萬物互聯、萬物感知、萬物智慧時代演進,海量資料資源集聚增速遠超摩爾定律,據IDC的數字宇宙報告,全球資訊資料總量中接近90%產生於近幾年,到2020年將達到44ZB。圖靈獎獲得者
大資料丨神州資訊“智慧資料工廠V1.0” :讓資料變得有價值
神州資訊“智慧資料工廠V1.0”通過中國軟體評測中心專業評測,被授予“大資料基礎設施類產品認定證書”,大資料能力獲得充分肯定。 ” 在當前數字化轉型的背景下,挖掘資料價值並使其有效落地,真正服務國計民生,已成為各家IT服務商的必爭之地。神州資訊智慧資料工廠([email
大資料時代:9種從大資料中獲取商業價值的方法
很多大資料都是來自一些新的來源,這代表客戶或合作伙伴互動的新渠道。和任何新的資料來源一樣,大資料值得探索。通過資料探索,你可以瞭解一些之前所不知道的商業模式和事實真相。關於管理大資料的調查顯示,89%的受訪者認為大資料是一個機會,而在2011年的大資料分析的調查中這個比例僅為
未來大資料發展和就業前景:大資料人才缺口到底有多大?
高考試卷已經結束,大多數考生將面臨與高考同等重要的問題:填報志願。今年,一個被認可的新專業吸引了許多人的注意——資料科學和大資料技術。“大資料”的概念再次流行起來。學生和家長在填寫志願者時應該冷靜下來。當前的大資料產業真的是人才稀缺嗎?幾年後,大資料產業會出現產能過剩嗎?大資
淺談資料倉庫、商業智慧、資料探勘、大資料、雲技術的前世今生。
開題之前先做宣告,以下內容純為我一家之言。 何為資料倉庫? 資料倉庫(Data Warehouse可簡寫為DW或DWH)。資料倉庫,是為企業所有級別的決策制定過程,提供所有型別資料支援的戰略集合
此文獻給正打算入門大資料的朋友:大資料學習筆記1000條(1)
1、Zookeeper用於叢集主備切換。 2、YARN讓叢集具備更好的擴充套件性。 3、Spark沒有儲存能力。 4、Spark的Master負責叢集的資源管理,Slave用於執行計算任務。 5、Hadoop從2.x開始,把儲存和計算分離開來,形成兩個相對獨立的子叢集:HDF
此文獻給正打算入門大資料的朋友:大資料學習筆記1000條(2)
501、MapReduce計算框架中的輸入和輸出的基本資料結構是鍵-值對。 502、Hadoop神奇的一部分在於sort和shuffle過程。 503、Hive驅動計算的“語言”是一XML形式編碼的。 504、Hive通過和Jobtracker通訊來初始化MapReduce任務(Job)。 505、M
大資料與人工智慧催生智慧時代
讀書筆記,資料來源:中國工程院院士鄔賀銓給吳軍的新書《智慧時代——大資料與智慧革命重新定義未來》寫的序。 科學研究四個正規化 吳軍認為科學研究發展經歷了四個正規化: 描述自然現象的實驗科學; 以牛頓定律和麥克斯韋方程為代表的理論科學; 模擬複雜現象的電腦科
關於大資料統計大量股票開盤平均價和收盤價的簡單程式程式
1.需要統計的檔案 2.單個檔案的內容 3.程式內容 package com.test4; import java.io.IOException; import java.util.Iterator; import org.apache.hadoop.conf.Configurat
大資料技術體系1(清華:大資料技術體系)
【1】採集與整合 【2】儲存與管理 【3】分析與挖掘 【4】視覺化 【5】計算範型 【6】隱私與安全 01資料質量-無法迴避的挑戰 傳統資料質量僅通過EFL方式執行,即抽取、轉換、載入,包括解析、模式分析等。 沒有完全覆蓋資料質量的基本性質 挑戰
貨拉拉大資料總監劉幸:大資料&智慧化體系的建立 | 2018FMI人工智慧與大資料高峰論壇(深圳站)
10月28日FMI 2018人工智慧與大資料高峰論壇深圳場圓滿落幕,貨拉拉大資料總監劉幸以大資料&智慧化體系的建立為主題進行了精彩的分享。 貨拉拉大資料總監 劉幸 以下是劉幸演講內容,飛馬網根據現場速記進行了不改變原意的編輯(有刪減):
免費下載 | 重磅:大資料標準化白皮書(2018版)正式釋出!
由中國電子技術標準化研究院主編的《大資料標準化白皮書(2018版)》正式釋出。在國家大資料戰略的推進實施下,我國大資料政策體系日臻完善,作為產業統籌佈局的重要支撐,大資料標準的技術支撐和引領作用進一步凸顯。 《白皮書》介紹了國內、國外主要國家在大資料領域的發展戰略、發展現狀和趨
Andrew Ng 機器學習筆記 15 :大資料集梯度下降
隨機梯度下降 隨機梯度下降原理 小批量梯度下降 小批量梯度下降vs隨機梯度下降 隨機梯度下降的收
大資料的簡介及Hadoop單機和分散式安裝方法1
hadoop:開源軟體,可靠的、分散式、可伸縮的大資料軟體(是一個生態體系包括但不限於:hive、spark、MR、persto、kylin) 國家提出去IOE戰略: IBM &nb