大資料分析思路的4點心得
大資料分析能力對於一名產品經理來說是最基本的能力。 在面試的過程中,社招會有面試官會問你以往你負責的產品的相關資料,如何看待這些資料,如何通過這些資料來做接下來的產品優化;校招的面試官可能會問小夥伴們關於分析資料的思維;在產品經理的日常工作當中,要時長盯著資料的報表來分析產品的健康程度。本文不再對一些基本的資料定義再做描述,而是從分析的思路總結了一些心得,歡迎各位一起來討論。
1.看資料的緯度
在對一款產品或者一款產品的其中的一個模組進行分析時,我們可以從兩個大緯度去分析資料。 首先是從廣闊的視角先去檢視資料,這裡需要對該產品所處的行業資料有一個清晰的瞭解,該產品所處的行業自己所處的市場佔有率的排名,一般市場佔有率指的是使用者的佔有量,一般從行業報告可以看出大概的資料。 然後接下來需要分析這款產品的總的資料情況,比如下載量、DAU、WAU、MAU等,以及該產品的最核心的資料是什麼,並且如何有可能從側面去了解這款產品的競品的相關資料是什麼。 當了解完以上這些總體的資訊,我們心中應該對自己所負責的產品有了一個巨集觀的概念,自己在行業內所處的位置,以及現在最需要提升哪些資料指標都有了一個清晰的認識。接下來就可以從大緯度切入到小緯度,進一步去分析一些細節的資料。例如重要的資料資訊,包括使用者的基本的構成資訊,每個模組自己建立的漏斗資訊等。一般在做分析的時候應該注意的是資料的異常現象,出現區域性的極值(包括極大值和極小值)都需要進行分析。
2.什麼才是好的資料指標?
在做資料分析的過程中,我們需要了解什麼樣的資料才是好資料,如果單純地去看一個數據是沒有太大意義的,資料本身也具有相應的欺騙性,比如從運營同學那得到了日新增使用者數1W,那麼單純看這個資料沒有什麼意義,我們可以說這個資料很好,因為看上去很大,但是你可能沒有看到同期的資料,有可能昨天的資料達到了2W。 第一,好的資料一定是首先最好是以比率的形式存在的,不要絕對數,要相對資料。 比如上面的那個資料我們換成增長率,換成環比這個資料,我們就可以進一步的瞭解到這個資料的好壞。 第二,就是通過對比來判斷資料的好壞。 我們將資料的日增長量做成一個折線圖,從折線圖我們就能看出這個資料是在高點還是在低點。通過對比,我們就會得知這個資料所處的位置是什麼樣的。另外,通過對比不同的渠道,對比不同的版本,對比不同的使用者群等不同緯度的資料,都可以從側面反映出這個資料的真實情況。 第三,資料不是一成不變的情況,要動態的去看資料。 單純只看一個點的資料情況是沒有意義的,我們要在資料中加入時間的緯度。引入一段單位的時間去看待資料整體的變化趨勢,這樣才能更為客觀的判斷產品的健康程度。
3.發現數據異常後將從幾個緯度去分析?
有時候從總量的角度是無法洞察出一些問題的。比如在某段時間內,下載量出現了下跌,我們需要去找到這個當中問題出現在哪裡。從總量的角度看,安卓的渠道要比IOS的總量大很多,這並不能說明問題。那麼我們首先需要將時間的緯度引入到當中,將這幾個月緯度的資料進行對比,一定可以看到在安卓當中有一個月份的數值相比其他較低。然後我們再去看這個月份的情況。一般情況下,在找到這個異常會先從渠道的角度去分析,檢視是哪個渠道發生了異常的現象。在針對性的去對渠道進行優化。 然後我們還可以從版本的角度去分析,去檢視最近近期是否有新版本的更新,如果有新版本的更新,是否設定了新的功能出現了BUG等問題無法解決,導致了使用者出現解除安裝應用的情況。當然這些角度都要加入時間的緯度去判斷。 另外,資料異常也不一定是壞事情。比如在分析使用者行為的過程中,如果發現了某些類別的使用者的關鍵指標表現良好,那麼就一定要分析為什麼這些使用者的資料表現為什麼十分良好,這也是增長黑客的分析思路。比如在facebook早期發現,如果一名使用者在剛使用產品的早期可以快速新增10明好友以上的使用者,這類的使用者的活躍程度就明顯高於其他的使用者。在比如airbnb在早期發現那些放置的照片十分精美的住家的出租率較好,發現了這個特性後,內部產品技術團隊又進行了一次AB測試,發現果然是存在這樣的優化點。 所以在早期一個關鍵的指標就是如何能快速提高使用者新增其他好友的數量。這裡需要我們從底層資料分析當中要注意對使用者進行分層的處理,從不同的緯度分層找到資料異常的族群,找到共性,歸納表現良好的使用者的共性,然後將其作為優化的指標進行優化。
4.不同階段制定的關鍵指標應該隨著產品的階段性變化發生變化的
在做資料分析的之前,需要我們對我們分析的目標進行確認,每個階段的目標也存在著不同的目標,是為了增強使用者粘性,還是為了提升營收,或者是為了提高病毒傳播係數。 比如在對渠道的判斷中,不能只關心拉過來的新使用者量,最重要的是我們要關心這些新拉過來的使用者對產品的關鍵指標的影響,比如在社群產品,相比新進使用者的數量更應該關心這些使用者的活躍度,釋出帖子的數量,點讚的數量等關鍵指標。換句話說更應該關注的是漏斗模型最下方的那個量,關注轉化率的最底層的那個資料。