1. 程式人生 > >大資料可能是一場騙局

大資料可能是一場騙局

編者按:本文作者馮大輝,丁香園CTO,雷鋒網特約撰稿人,想要聯絡的讀者可以在微波@Fenng

幾乎每天都能看到有人在談論大資料,讓人好生厭煩。什麼是大資料(Big Data) ? 簡單一點可以理解為超出傳統資料管理工具處理能力的大規模、複雜的資料集合(1)。判斷是否資料大資料的範疇,要從三個維度來衡量:資料量(Volume)、處理速度( Velocity)以及資料種類(Variety)。

大資料(Big Data) 是 2012 年資訊科技領域最時髦的詞彙。當然,跟所有曾經的時髦技術熱詞一樣,最後可能是一場騙局。為什麼?

大資料是個相對的概念,新瓶裝舊酒

有些人所說的大資料處理方式,不過是在既有的方案上包裝了一下,新瓶裝舊酒,只為趕時髦。今天的大資料可能到了明天算不上大資料。過去我們也曾經對「海量資料」望而生畏。但海量資料時代並沒有給多少企業帶來革命性的變化,在 MapReduce 以及 Hadoop 出現之前,沒有多少企業能夠輕鬆的對資料進行大規模平行計算(奇怪的是,那時候沒有多少人提大資料)。而 NoSQL 的出現也為處理資料的方式帶來了更多可能性。我們突然發現,處理資料能力已經悄然增強。

大資料是機會,但不是所有人的機會

大資料的商業前景被過分誇大了。到目前來看,只有為數不多的企業真正擁有大資料,而且這些資料的管理、處理、分析並沒有帶來所謂空前大的挑戰。因為新的工具、新的計算方式已經已經具備處理這些資料的能力。

大資料是機會,但只是少數人的機會,更多是巨頭們的商業障眼法,比如 IBM 、Oracle、微軟,他們提倡甚至誇大大資料的目的還是為了向你兜售他們的工具,兜售他們的解決方案,確切的說,從你身上賺錢。更有甚者,居然是向你兜售硬體,這不完全是扯淡麼? 大硬體還差不多。

中小型公司應該繞道走,別唯大佬們馬首是瞻,別總去湊熱鬧。你所需要的東西,通過開源社群就可以獲取到,參加各種大佬們口沫橫飛的會議還不如和工程師聊聊可以運用什麼工具來具體操練一下。「適用」好比什麼都重要。創業公司也應該繞著「大資料」走,這未必是個好方向。

大資料的確會有價值,但沒有那麼大

必須要承認從某些大資料中會挖掘出新的價值,但這個價值只是附加價值,沒有理由去誇大他,更沒有理由去無端的想象。你可以說這篇沙漠可能有金子,但並不是說沙漠中一定就能挖掘出金子。

從現在業界一些公司拿出來的所謂的大資料應用例項來看,依然只是在利用傳統意義上的資料價值,只是巧妙地把這筆帳記在了大資料上而已。一個電子商務網站說「什麼地方的人買東西最瘋狂」或是「什麼型號手機最好賣」,這會是大資料分析的結果,完全是扯淡嘛。難道資料倉庫系統分析出來的結果和這個大資料出來的結果會有不同麼?

不算結束的結束語

大資料不會是什麼「商業模式的變革」,重視大資料,但沒必要抱著大資料的大腿,尤其是在業界對於「資料」還不夠重視的時候,就更別說大資料了。相信隨著時間的推移,大資料這個詞會和資訊爆炸、網格計算、雲端計算等逐漸被淡忘,當然,到時候可能出現新的時髦詞彙了。

沒有大資料,只有資料;沒有藍海,只有大海;沒有先知,只有忽悠。

fenng 供雷鋒網專稿,轉載請註明!)