1. 程式人生 > 其它 >談談我自己對資料分析師的認識

談談我自己對資料分析師的認識

先從我為什麼選擇這個職業方向開始談吧

我大學的專業是工商管理,課程主要以理論和定性分析為主,雖然也會學一些數學課程和定量模型,但整體上更多地還是教授一些商業分析思維和模型,如波特五力模型、4P、管理職能、波士頓矩陣、SWOT、PEST等。在使用這些模型時,深感很多判斷和決策都是憑感覺做出來的,是務虛,所以希望能夠用務實的資料分析作為研究方法和路徑。

而按照工作的實際需要,資料分析師職能會有所側重,所以有必要梳理一下資料分析的全流程。為便於理解,此處與做菜進行類比:

資料分析和做菜的流程對比

1、資料分析的第一步是得先要有資料,這涉及了相關功能的埋點設計、資料傳輸、資料儲存等環節,基本上屬於資料庫的內容,這一塊我目前接觸得較少,所以暫不過多闡述

2、第二步是從儲存了資料的資料庫中採集分析所需要的資料,這一步裡最常用到的技術就是SQL了,當然也包括了從網頁上爬取資訊的爬蟲技術

3、第三步的資料清洗往往會同時出現在資料採集和資料分析過程中,如正則化處理、SQL語句優化、缺失值處理、異常值識別等

4、而第四步才是資料分析和挖掘,包括了統計分析、A/B test、相關性分析、特徵工程、建模等,這一步其實又包括了通過簡單的資料視覺化來加深對原始資料理解的過程

5、最後是第五步的視覺化,資料視覺化做得好逼格一下子拉滿,就像是擺盤的好壞決定了做出的是好吃的家常菜還是三星米其林菜一樣

第一步關於資料庫的開發和運維,其實和通常意義上資料分析師已經離得比較遠了,就像是農民和廚子的差別一樣,但是資料分析師瞭解資料庫的底層架構並沒有壞處,就像是廚子知道菜是怎麼種出來的、有什麼品種、哪個季節適合種什麼等知識總是沒壞處的。但是在招聘市場上,儘管有些企業會單獨招聘大資料開發工程師,但也有企業招聘資料分析師時會要求其熟悉資料倉庫模型設計,所以作為資料分析師想要升級加薪走上人生巔峰,那這一塊的知識就很難繞過去。而第五步的資料視覺化,其重要程度甚至有一些企業會單獨招BI視覺化工程師以及在內部開發一個數據視覺化平臺,而且還有許多單獨的軟體如Tableau、Power BI等對這一塊進行優化,畢竟有時候故事本身不是最重要的,更重要得是這個故事如何講出來。

而如果一個數據分析師能夠掌握從資料產生到最終視覺化各環節的技術,我願稱之為——全棧,而我的目標以及該系列的目標也是朝全棧資料分析師邁進的。

至於資料分析的價值,在我工作的時候其實是有人提出過質疑的。當時我發出部門的月度分析報告後,一個負責具體業務的經理認為該報告做得很好,資料很詳實、圖表也很充分,但他不知道有什麼用,希望與大家共同探討資料分析的價值這一問題。當時我群回了一封郵件,對該問題闡述了自己的想法。我所認為的資料分析的價值概況起來就是:

瞭解過去,把握現在,指導未來

落到實處就是說資料分析要為業務服務,不能為了分析而分析。每一次的分析都需要帶有目的,每次一次的分析都需要有結論,每一次的分析都需要朝改善業務而努力。企業最終的目的是賺錢,而資料分析則是達成這一目的的一條路徑和一個手段。以寫slogan為例,好的slogan能吸引客戶進來消費,進而產生盈利,但哪個slogan最好呢?資料分析可以瞭解到使用某個slogan時有多少客戶完成消費,當更換新的slogan並控制其他變數時又多少客戶完成消費,如果更換後效果好則繼續用,否則沿用初版的slogan。如果不看資料,我們永遠不知道哪個slogan更好,而選用最好的slogan後,其額外產生的消費就是資料分析的價值。

關於資料分析的價值以後有機會的話我再展開來談,該系列的前言部分就先到此為止。

最後是預告部分,因為我最近在重溫和學習各類的演算法模型,所以接下來的一段時間我都會以更新演算法模型為主,通過整合不同的資料然後按照我自己的思路重新講解,下一篇我將從一元線性迴歸開始講起。

[Moly的資料分析師之路——前言 - 知乎](https://zhuanlan.zhihu.com/p/113590624 )]