1. 程式人生 > >什麼是大資料概念

什麼是大資料概念

  現在說起大資料,那是相當火的“時髦詞”,大家在炒概念,大資料並不難,怎樣利用大資料還是很難得,在我看來,目前很多人都在吹噓大資料。但是真正懂大資料的人卻寥寥無幾,下面我們來聊聊大資料概念:

  大資料(big data),簡單來說就是巨量資料集合(IT行業術語),百度百科詞條的解釋是這樣的:指無法在可承受的時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的資訊資產,

  在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大資料時代》中是這樣定義大資料的:指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有資料進行分析處理。大資料的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)Veracity(真實性)。

  大資料是需要更新模式才能具有更強大的決策力,洞察發現力和流程優化能力來適應海量,高增長和多樣化的資訊資產。大資料有以下幾點內涵吧:

  1. 資料量大,TB,PB,乃至EB等資料量的資料需要分析處理。

  2. 要求快速響應,市場變化快,要求能及時快速的響應變化,對資料的分析也要快,在效能上有更高要求,所以資料量顯得對速度要求有些“大”。

  3. 資料多樣性:不同的資料來源,非結構化資料越來越多,需要進行清洗,整理,篩選等操作,變為結構資料。

  4. 價值密度低,由於資料採集的不及時,資料樣本不全面,資料可能不連續等等,資料可能會失真,但當資料量達到一定規模,可以通過更多的資料達到更真實全面的反饋。

  現在的社會是一個快速發展的時代,科技發達,資訊流通,人們之家的交流越來越密切呢,生活也是越來越方便,大資料就是這個高科技時代的產物;很多行業都會有大資料需求,譬如電信行業,網際網路行業等等容易產生大量資料的行業,很多傳統行業,譬如醫藥,教育,採礦,電力等等任何行業,都會有大資料需求。大資料與各個行業的深度融會,將發生出前所未有的社會和商業價值。

  馬雲曾說過,未來時代將不是IT時代,而是DT(Data Technology資料科技)的時代,顯示大資料對於阿里巴巴企業來說舉足輕重。

  這是本人理解的大資料概念, 如果有不對的地方,希望諒解,也希望你們多多補充,讓我們感受和期待大資料未來的發展

  本文出自檸檬派(http://www.lemonpai.com/1419.html 在Apache Hive中輕鬆生存的12個技巧 )轉載請務必保留此出處 ,否則將追究法律責任!