1. 程式人生 > >我是如何入門、成長並進階為數據分析師的?

我是如何入門、成長並進階為數據分析師的?

數據分析師 數據分析

前幾天和一朋友A聊天,一個在我看來完全可以在大部分行業領域公司獨當一面的數據分析師,目前仍謙虛的以“數據猿”自稱。從事數據分析的他,半路出家,起初雖然懂一些數據庫的知識,但仍然和很多人一樣,艱難地上了路。於是我們就索性一起討討經,“一本正經”地聊起工作來,留下點感悟。

數據分析如何起步?

說入門很簡單一定是騙你的,A說自己是從記數據開始的,記數據一方面是為了應付領導的提問,另一方面也是在培養數據的敏感度。確實,分析的源頭一般是某些指標有了明顯的變動,熟悉每天的交易數據或用戶數據能讓你一眼就看出問題在哪裏,哪些數據有關聯,然後再做分析。而我是從Excel做起的,大部分時間都是在取數,做“表哥”,還要抵擋來自業務的需求攻擊。後來,他去做了數據挖掘,我從BI再從數據平臺轉做了技術。

萬事開頭難,但一旦數據分析有了動力,就要開始完善自己的知識體系,這也是真正入門的開端。那如何完善數據分析的知識體系?

1、基本的計算機知識和統計知識

數據庫+SQL語言

一些常用的數據庫如Oracle、SQL Sever、DB2、MySQL,這些數據庫或者說日常接觸的數據庫都要有所了解,懂最常用的就好,最重要的還是要會寫SQL。

數學/統計學知識

一些基本的數學統計方法如描述性統計、多元統計分析、回歸分析等,重要性不言而喻。

數據挖掘知識:方差分析、回歸分析、因子分析、聚類分析等等。這些東西作為入門多多少少都要會一些,雖然有可能不會全用到,但一旦用時方恨少。

數據分析可視工具

數據分析可視化工具很寬泛。首推Excel,中小公司很依賴,熟練使用數據透視表,這是必備技能。中大型公司都是用報表工具或者BI來做報表,但有了SQL+Excel的基礎,這些工具上手都很快。

2、業務知識

數據分析師要與公司的各業務打交道,所以對於各部門的業務知識要有深入的了解。某業務領導需要知道某個指標,你需要知道這個指標由哪些數據構成?數據統計的口徑是什麽?數據怎麽取出來?這個指標對於行業的意義是什麽,處於什麽範圍分別對應什麽樣的情況,是好還是壞。然後慢慢摸索這個指標層面多維度的規律,如何設定最合理。

明確自己的位置,快速成長

附上網上的一張數據分析師能力體系圖,用於參考。

技術分享

數據分析是一向比較專業的工作,要時刻警惕自己能力是否有提升,目前是什麽樣的水平,習慣反思自己:

[email protected]

1、你了解你所整理的數據的來源嗎?是自己公司的業務數據,還是與合作夥伴交換的數據?是自己公司相關部門采集的,還是從第三方獲取的?獲取過程中,具體的指標和邏輯是什麽?

2、這些數據是真實的嗎?采集和整理過程中會不會出現什麽問題?技術上的邏輯和業務上的邏輯是不同的概念,有沒有技術上沒有瑕疵,但並不符合業務邏輯的數據流程?

3、到你手裏的數據經過了什麽處理?你又做了什麽處理?為什麽他們和你要做這些處理?

4、誰需要你的數據?你處理後的數據流向哪裏?他們用數據做什麽?這些數據最終又拿去做了什麽?比如,為客戶做了什麽服務,公司發布了什麽內容,或向管理層證明了什麽KPI,或支持了哪個部門的評估?

5、你做整理的周期是什麽?為什麽是這樣的周期?

6、公司有其他的部門在處理其他的數據嗎?是什麽樣的數據?和你有什麽關系?為什麽這些數據要分開處理?

7、近一年,你自己的電腦上應該已經積累了不少數據,試試做個分析,從一段較長的時間來看,你負責的這一塊數據發生了什麽變化?為什麽會有這個變化?和公司的產品、經營、業務有關,還是和行業有關?具體怎麽有關?

如何進一步提升?

業務上

1.業務為核心,數據為王

  • 了解整個產業鏈的結構

  • 制定好業務的發展規劃

  • 了解衡量的核心指標

  • 有了數據必須和業務結合才有效果

需要懂業務的整體概況,摸清楚所在產業鏈的整個結構,對行業的上遊和下遊的經營情況有大致的了解。然後根據業務當前的需要,指定發展計劃,從而歸類出需要整理的數據。最後一步詳細的列出數據核心指標(KPI),並且對幾個核心指標進行更細致的拆解,當然具體結合你的業務屬性來處理,找出那些對指標影響幅度較大的影響因子。前期資料的收集以及業務現況的全面掌握非常關鍵。

2.思考指標現狀,發現多維規律

  • 熟悉產品框架,全面定義每個指標的運營現狀對

  • 比同行業指標,挖掘隱藏的提升空間

  • 拆解關鍵指標,合理設置運營方法來觀察效果

  • 爭對核心用戶,單獨進行產品用研與需求挖掘

業務的分析大多是定性的,需要培養一種客觀的感覺意識。定性的分析則需要借助技術、工具、機器。而感覺的培養,由於每個人的思維、感知都不同,只能把控大體的方向,很多數據元素之間的關系還是需要通過數據可視化技術來實現。

3.規律驗證,經驗總結

發現了規律之後不能立刻上線,需要在測試機上對模型進行驗證。

技能上

1.Excel是否精鉆?

除了常用的Excel函數(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel圖表(餅圖、線圖、柱形圖、雷達圖等)和簡單分析技能也是經常用的,可以幫助你快速分析業務走勢和異常情況;另外,Excel裏面的函數結合透視表以及VBA功能是完善報表開發的利器,讓你一鍵輕松搞定報表。

技術分享

2.你需要更懂數據庫

常用的數據庫如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL語句的熟練使用,對於數據庫的存儲讀取過程也要熟練掌握。在對於大數據量處理時,如何想辦法加快程序的運行速度、減少網絡流量、提高數據庫的安全性是非常有必要的。

3.掌握數據整理、可視化和報表制作

數據整理,是將原始數據轉換成方便實用的格式,Excel在協同工作上並不是一個好工具,報表FineReport比較推薦。項目部署的Tableau、FineBI、Qlikview一類BI工具,有沒有好好培訓學習,這些便捷的工具都能淡化數據分析時一些重復性操作,把精力更多留於分析。

技術分享


我是如何入門、成長並進階為數據分析師的?