1. 程式人生 > >大資料是啥,可以吃的嗎?

大資料是啥,可以吃的嗎?

作者|影姿

關於大資料是什麼,從一開始僅僅只想做資料,到開始意識到自己做的是對整個集團有核心意義的資料產品,再到走到外面,把資料能力對外輸出,所有過程中,不斷的有客戶問到這個問題,有懵懂的、有善意的、也有挑釁的、不屑的。就像大資料本身一樣,混亂又帶有迷幻色彩。

現在對大資料的理解有兩種極端:站在大資料的風口,很多人覺得大資料是未來,可以解決所有問題,包括人工智慧;我自己不用想,大資料已經替我想好決定好一切了;還有一種,是大資料的概念炒了好幾年,冷飯都抄成鍋巴了,但是嘗試過人的只收集齊了幾萬點傷害,覺得大資料不過如此

大資料並不一定要資料達到了多少體量才能算是大資料,但是如果資料簡單量少到只需要用xlsx、SPSS等傳統資料處理就能解決,就不需要再用大資料技術,有點殺雞用牛刀的感覺。但大資料應用一定並不僅僅指分析,跳出傳統資料分析的範疇,大資料應用領域可以指導使用在我們所有的生活工作業務、場景領域,例如個性化推薦、精準營銷、風險監控等。

這幾年多多少少沉澱下來的經驗,和老闆時謙虛時叫板時被罵總結到的體會,加上偶爾抽筋想增加修養磕磕絆絆看的書,有幾點關於大資料的基本特徵可以和大家探討:

一、非競爭性

現在很多企業,對資料的保護是非常嚴格的,大家都覺得自己的資料很有價值,不能隨便給別人使用。曾經有一度,我在做資料聯盟的時候(這個可以以後另開一篇文章講),每次和客戶聊,都想傳達一個概念,資料如果是一種資源,那也是可以被眾多消耗方同時使用和反覆使用的資源,個體的使用不會妨礙他人的使用。資料只有越被使用才能積累資料的應用價值(當然裸資料直接售賣的方式不在我所討論的大資料應用範疇)。

二、價值無定值

延續上面說的,裸資料直接售賣,在我們積累了大量的資料應用實踐經驗之後再回過頭來看,是覺得非常可笑的,所有想對某個資料欄位定價,然後公開買賣的,都是短時和自絕的行為(個人觀點,不要動磚頭)。資料就像是無形資產一樣,市場估值取決於買者對該項資料的需要程度,合適的資料服務應用於某個客戶產品,產生的作用千差萬別,硬要給某個資料定一個價,只能讓資料貶值或讓高買者對大資料產生不信任

。但是並不是說資料是無價的,資料一定要有一個價值,然後讓它流動應用起來,不斷調整迭代到合適的附加值,聰明的資料應用者會最大程度利用具有真正附加值的應用模式創造財富。

三、會問問題

沒有能夠自動從大資料中獲取經濟價值的方式,沒有捷徑和想當然,我反對所有說只要有大資料就什麼也不需要乾了的說法。企業單純的儲存資料沒有什麼用處,而儲存什麼,清除什麼,業內可以選擇的高階技術都已經準備好靜待選擇。現在對於一家企業來說:前瞻性的深入理解哪些資料值得首先儲存和處理,是第一要務。

大資料只提供答案,但它對該問的問題保持緘默,這些問題來自負責人的智慧,提出怎樣的問題視關鍵!就像柏拉圖說的那樣:最終獲勝的將是那些“知道如何提出問題的人”,只有那些知道怎麼樣提出問題的人才知道,哪些資料可能會回答問題,如何用這些資料回答問題。

大資料行業裡最缺乏或者將來身價最高的人,就是既理解業務,又瞭解資料,知道怎麼提出業務的問題,也知道怎麼用大資料解答問題的大資料專家(打個廣告:歡迎來數瀾應聘產品經理提升身價)

**大資料技術提供了高階快速的尖端技術,使得大資料處理技術能夠日行千里。**但是如果不選擇正確有效的方向,反而累加為錯誤支付的成本。在大資料時代,一個正確的方向,正確的提問,正確的思路,比高精尖的科學技術、海量實時的模型演算法更重要。

四、資料要有活性

長話短說,資料有保質期,需要不斷更新,沒有任何資料是一塵不變的,資料如果不更新,就像死水一樣,所以如果有資料,就要趕緊用起來,存著又不知道該怎麼用,存久了價值就指數下降了。

五、不直接售賣

也許大家覺得直接售賣現在也形成產業鏈了,看起來也是一種新模式了,我只想說說直接售賣的弊端:

(1)資料本身沒有確切的定價,過早定價會降低溢價空間;

(2)售賣的方式無法形成技術壁壘(今天討論的是大資料商業應用領域,科學研究是另一個話題),購買的資料可以再次低價售賣,形成惡性迴圈做低資料價值;

(3)資料安全問題,個體資料無法通過直接售賣的方式進行應用,但個體資料是非常值得研究和應用的資料內容,需要尋找一種安全脫敏合法的方式,將大資料反哺便利使用者日常生活。

六、相關性而非因果性

中國人傳統的理念講因果,因此“大資料在乎相關性而非因果性”這個觀念從國外傳來時還是很顛覆的,不過大資料因為其強大的“廣泛資料都可計算”特性,使得不需要再探究因果,根據現有充足海量的資料就可以做出分析或預測。但是關於這個特徵是不是還要再顛覆一次,搞清楚因果,我還在實踐中,也歡迎有體會的朋友們拋磚。

【文章來自一個愛吃的資