1. 程式人生 > >問題來了,大資料的特性究竟有多少個V?

問題來了,大資料的特性究竟有多少個V?

—— 原文釋出於本人的微信公眾號“大資料與人工智慧Lab”(BigdataAILab),歡迎關注。

一提到大資料的特性,很多人馬上就會想到3V、4V,那麼大資料究竟有多少個V呢?

在大資料的不斷髮展階段,業界對大資料的特徵認識也在逐步完善,涵蓋範圍也更加全面。

1、3V

2001年麥塔集團(META Group)分析師萊尼在一份報告中對大資料提出了“3D資料管理”的觀點,即認為大資料將往高速、多樣、海量3個方向發展,提出了3個特性:高速性(Velocity)、多樣化(Variety)、規模化(Volume),統稱3V。

3V特性是大資料最具代表性的特性,被麥肯錫、IBM、微軟等多家公司所認可並不斷在大資料報告中提及。IDC(International Data Corporation,國際資料公司)在給大資料下定義時便是引用了3V的特性:“大資料技術是新一代的技術與架構,它被設計用於在成本可承受的條件下,通過非常快速(velocity)的採集、發現和分析,從大體量(volumes)、多類別(variety)的資料中提取價值”。

2、4V

4V也是廣受認可的大資料特性,在3V的基礎上再加上了價值(Value)的維度,主要強調大資料的總體價值大,但價值密度低。

規模性(Volume)、多樣性(Varity)、高速性(Velocity)和價值性(Value),合稱“4V”。

另外,還有一種大資料觀點是“4V+1O”,在4V的基礎上再加上1個O,即資料線上(Online),強調資料永遠線上,能隨時呼叫和計算,這也是有別於傳統資料的特性之一。

3、5V、6V、7V、8V

隨著大資料技術的不斷髮展,資料的複雜程度愈來愈高,不斷有人提出了大資料特徵新的論斷,在4V的基礎上增加了準確性(Veracity),強調有意義的資料必須真實、準確;增加了動態性(Vitality),強調整個資料體系的動態性;增加了可視性(Visualization),強調資料的顯性化展現;增加了合法性(Validity),強調資料採集和應用的合法性,特別是對於個人隱私資料的合理使用。

下圖展現了3V到8V的特性圖

歡迎關注本人的微信公眾號“大資料與人工智慧Lab”(BigdataAILab),獲取更多資訊