資料分析會犯的錯誤,新人十有九中(轉)
BY
講一個很嚴重,很明顯,但是很容易被新人們忽視的錯誤:把要求當需求。最最最典型的,某過於老闆丟了句“做個使用者畫像看一下”於是資料專員吭哧吭哧跑資料,做詞雲,畫圖示,碼PPT。忙得不亦樂乎。最後辛辛苦苦交了使用者畫像的報告。老闆一句話劈頭蓋臉丟過來
“我早知道了”
“你做了有什麼用”
“這不是我想要的”
那感覺,簡直就是一盆冷水潑下來,一口老血湧上頭。好想拿出錄了“做個使用者畫像看一下”的錄音筆查到丫耳朵裡。這還是好的呢。如果碰到一個不怎麼懂的話題,比如“做個聚類分析”“做個因子分析”,可能跑數的小哥還得到處找資料,查書,上各種《資料分析愛好者》QQ群問:“有沒有大神教一下怎麼做啊??”結果回來還是碰壁,就真的氣不打一處來了。
問題出在哪裡?問題出在從一開始,這就不是需求,而是一個要求。並且它是出自非專業人士的要求。舉個類似的例子,就好比病人去醫院看病,對醫生說:“來個感冒藥”然後回頭說醫生“你這藥不靈啊!你這醫生會不會看病啊!”你說這醫生當的冤不冤。
冤,也不冤。冤,是冤在明明是病人自己要求的,我按你說的辦,為啥讓我背黑鍋。不冤,是因為大家默認了醫生就是專業人士,doctor的另一重含義就是博士,為什麼一個專業博士要聽不懂醫的人安排呢?所以作為專業人士,就得提專業意見。而不是聽風就是雨。就算病人指名道姓的要感冒藥,你也得問他到底是什麼病,對症下藥才是正道。
具體到資料分析上,類似“使用者畫像”“聚類分析”“迴歸演算法”只是具體的分析工具,而不是要分析的問題。領導要求看使用者畫像,可能是因為之前不瞭解我們的使用者群體特徵,想要看個概況;也可能是因為對某一類使用者有了思考,想看深入分析。這裡要我們進一步去挖掘需求,而不是停在表面。具體來說,可以按思路如下圖所示:
先確認做這個的目的是什麼,是不是想了解使用者?是不是瞭解使用者有具體問題?摸清底細再動手
這樣一層層開展,不但能弄清楚問題到底是什麼,而且可以順便了解下領導期望值。哪些是已知的結論,哪些是未知領域搞清楚,就可以避免“我早知道了”的尷尬。把真正的問題找到,就能避免“你做了有什麼用”的窘境。兩者結合,自然是做出“我想要的”結果。
這樣做的另一個好處,是聚焦問題、排除干擾。對於“使用者畫像”這種可大可小的問題特別合適。因為一提到“使用者畫像”,大家都會想到一堆使用者相關的指標,問題是:我們有沒有這些資料?我們有的資料靠不靠譜?是不是解決問題一定需要這些資料?如果不聚焦問題,做出來的東西沒有用還是小事。為了搞這個沒有用的東西而大費周章,勞民傷財,最後還不落好,就是大事了。當然,業務方可以隨口一說:我們需要用“大資料使用者畫像”解決XX。但做資料的同學們,就得特別小心觀察,到底用哪些資料,具體到一個個欄位。
再進一步的討論,可以看業務方解決問題的限制。因為實際上能解決問題的手段非常有限。比如業務方想了解“高階使用者”的畫像。很有可能連這些人開什麼車,吃什麼館子,看什麼報紙,蹲什麼茅坑都想知道。問題是知道這些維度又能怎樣?去廁所門上刷小廣告“槍支麻藥迷昏劑”嗎。這種接近窺探隱私的、超細節的分析,更適合用調查的方式進行。資料分析基於內部系統採集資料,還是更適合做基礎性的常規採集。這時候可能聚焦:高階使用者從什麼渠道進入,有什麼消費習慣,對哪些品類更忠誠,更容易輸出有價值的結果。
一提到使用者畫像,大家就像各種稀奇古怪的欄位,可聚焦到一個問題,比如促銷費的問題,這些欄位遠沒有獲客渠道、產品組合、營銷活動這些欄位管用
類似的問題還有很多,比如“做一個判斷模型”“做一個聚類分析”“做一個迴歸預測”這些都是具體的要求,而不是需求。遇到這一類問題,一定要打起十二分精神,問清楚:
-
做一個模型用來解決XXXX問題?(真實痛點)
-
這個問題有沒有預判或假設?(真實困惑)
-
解決問題的時間、方法有沒有限制?(可行性)
這樣摸清底,後續就會做出
-
很想要的(真實的痛點才真實想要)
-
眼前一亮(解決了真實的疑惑)
-
非常有用(考慮了執行可行性)
的分析成果。廢話,我們已經到他們知道什麼不知道什麼嗎。很多同學苦思冥想,試圖想出一個業務方見都沒見過的東西,以為這樣才算是分析的高深。殊不知,真要丟出這種結果,十有八九會得到一個:“太離譜了,不符合業務邏輯”的評價。其實好的分析成果不一定複雜,不一定異想天開。答疑解惑,藥到病除,才是最好的狀態。
其他的問題還有很多,限於篇幅,回來慢慢分享,之所以只說了這一個,因為這個是方向問題。是頭等問題。這個問題不解決,只怕後續的問題會越來越多。可恰恰在這裡,新人們往往不敢深入討論,怕被鄙視能力不行,怕被人給臉色。可為什麼老手們不怕呢?一來是被坑多了,知道為了面子拿自己去填坑不值當。二來是表達技巧會更好,一圖以蔽之,看下邊。
瞭解需求和審問需求方是兩個問題,板著臉問:“你為什麼要這個數”肯定被人罵,溝通方式可以靈活機動。當然,如何溝通,是另一個複雜的問題了。
對了,開頭的問題已經很有技術含量了。至少提需求的時候提了“使用者畫像”四個字。更慘的場面,可能是這種:
“那誰誰,我要個數”
這時候就得更加小心了哈。本質都是一樣的,這也是個要求。然而又有很多同學聽到要個數,就急匆匆的跑數去了……o(╯□╰)o