1. 程式人生 > >乾貨 :5個提醒,讓你遠離“資料呆

乾貨 :5個提醒,讓你遠離“資料呆

隨著資料積累得越來越多,資料獲取成本不斷降低,人們開始走向另一個危險的極端,那就是任何事情都要看資料,任何決定都去依賴資料。這種風氣培養出了越來越多的“資料呆”。作為一個數據分析師,我是非常反對“唯資料論”的。為什麼呢?讓我詳細地來說一說。

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴
 

  • 資料庫並不能記錄一切

你覺得,通過資料庫中的記錄,你能夠充分了解你的業務嗎?答案是否定的。說白了,資料庫只是記錄了發生在業務鏈條上的行為,但行為的結果並不代表業務的全部。舉個例子,通過使用者的使用行為資料,我們就能知道使用者的體驗嗎?答案是不能,我們只是根據使用者的“行為結果”去猜測他使用體驗的好壞。真正的使用者感覺,在他們的心理,許多時候,不會通過既定的使用路徑和產品功能提現出來。

 

那麼,資料庫不能記錄的資訊,怎麼獲取呢?答案其實很簡單,通過外部手段,創造條件去獲取。概括為“調查”和“實驗”兩個詞。比如使用者體驗不能量化的問題,直接問不就好了?調查分為訪談和問卷調查兩個方式,每種方式都需要落地成可量化的結果。問卷調查建議規律性地長期進行,連續收集的資料在時間維度上可比,價值遠遠大於單次的問卷調查。實驗的方式在第四章中有所論述,它正是一種創造資料的手段。通過實驗組和對照組,創造出一個對比的條件,進而量化出差異,最終形成可靠的判斷。

 

  • 不可能分離多重因素影響

我們在運營當中最容易犯的錯誤就是試圖用一個“巨集觀指標”的變化來評估某個細節動作(策略的改變、產品的改變或者活動的改變)的影響。做這件事情好比買彩票,幸運的時候,某個運營動作對業務的影響非常大,那麼從指標中能反映出來。但絕大多數時候,不管是策略的變更還是產品的改進,對業務全域性的影響都是有限的,巨集觀指標(往往是KPI)的變化並不敏感。真正要做的是就事論事,根據具體的行動,去定義一個信度和效度高的指標。

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴

另一個角度,業務指標的變動往往是多種運營動作共同施加的結果,這種影響並不能簡簡單單的分解為“A+B+C+…”或者“A*B*C*…”。有些因素疊加可能相互放大影響,有些則可能相互抑制,巨集觀指標只是這眾多影響的結果,內部的影響機制是黑箱。極端點說,不可能將每個因素的影響都分離出來。

 

那麼怎麼辦呢?怎樣能衡量具體某個運營動作帶來的影響呢?答案就是實驗,也只有實驗。就是通常所講的AB測試。實驗中,運營動作施予物件必須分為實驗組和對照組,實驗組和對照組唯一的不同,就是實驗組被施予了運營動作,而對照組沒有。只有這樣,觀察實驗組與對照組的指標差異(方差分析或者DID),我們才有可能去量化某個運營動作的影響。

 

  • 資料不能替代邏輯推理

一個邏輯混亂的人,給他再多的資料,也不會得出正確的結論。能否形成正確的判斷和合理的決策,很大程度上並不是資料的多少,資料足夠(資訊充分)就可以了。很多時候,我們真正要鍛鍊的是自己的分析問題的能力,或者說邏輯思維能力。尤其是在“根據資料變化查詢問題”這樣的場景中。

 

要對這一點有深刻的理解,希望大家讀我的《資料驅動決策的13種思維方式》。你是不是一個明智的決策者,並不在於你手頭有多少的資料,而在於你能否從資料中正確地解讀資訊。需要提醒各位的是,當資料達到一定的量後,資料越多,往往資料質量越差,你犯錯的可能性越大。你是否記起了本書第一章最後部分,資料圖中指標數量與混淆概率的關係了?

 

 

  • 預測的根基未必牢固

資料分析工作,很大一部分是為了“預測”。所有預測模型的“根基”都是“通過過去發生的事來預知將來的事”。說得更玄乎一點,就是“歷史是會重演的”。但這個基本邏輯靠得住嗎?

 

從我的個人經歷來說,許多時候是靠不住的。這也是我在工作中很少進行預測型建模的原因。在我所處的網際網路行業,業務變化非常快。一個“政策”的決定,往往造成各項業務資料的鉅變。經常是“一夜回到解放前”或者“一晚跨入新時代”。在這種背景下,重要的不是去對某個指標進行預測,而是理解業務背後最根本的商業邏輯(商業模式)。若一個商業邏輯被證明是有效的,那麼它在相當長的一段時間內不會變化,那麼你就能獲得一些“定性”的預測能力,這就足夠了。

 

  • 大多數人會因資料而變傻

為什麼這麼說呢?在我的工作經歷中,大多數的管理層,都會因為資料資源的豐富而或多或少地放棄思考。放棄思考意味著變傻,難道不是嗎?許多人,自身因為長期業務經驗的積累,其實是有很好的直覺的。而現在,卻被一個不熟悉業務,只會從資料庫中做些統計的所謂資料分析師牽著鼻子走。實在是“可歌可泣”。許多人過分地依賴資料統計了。這個現象是值得警覺的。

 

曾經有一位學者告訴我,資料分析使人短視甚至盲目。開始我不以為意,但之後越來越覺得這話有道理。為什麼呢?現實情況是,許多人有了資料資源後,放棄了最基本的商業思考,不斷地去統計資料,不斷地去提“幫我查一下這個數字,幫我看一下那個數字”這樣的需求。失去了思考的深度,非常危險。

 

我覺得,真正的資料分析(業務分析),應該有很高的門檻。這個門檻並不來自於分析方法的應用,而來自於對業務的理解。只有對業務有深刻的理解,才能將分析方法用對地方,才能正確地解讀資訊,獲得結論。

 

所以,許多深耕在業務中的管理者,不需要因為資料資源的爆炸而驚慌失措,真正有價值的東西在你們經驗裡,只需要有一個量化的出口,你才是那個將資料價值發揮到最大的人。

在這裡我還是要推薦下我自己建的大資料學習交流qq裙: 957205962, 裙 裡都是學大資料開發的,如果你正在學習大資料 ,小編歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有大資料開發相關的),包括我自己整理的一份2018最新的大資料進階資料和高階開發教程,歡迎進階中和進想深入大資料的小夥伴

那麼問題來了,如何做到不因資料而變傻呢?我沒有答案。我認為在未來,不應該有資料分析師這個職業,而應該是所有決策者都懂得“分析資料”。這實際上是寫作本書最深層的一個目的。當所有決策者都能正確地獲取資料、合適地應用分析方法,得出可靠的結論時,我們的商業將進入一個新的階段,商業智慧才真正落地。

 

最後,我還是想強調,任何人在應用資料前,都要記住這樣一句話:“對業務的理解和思考,永遠高於分析技術的選擇”。