1. 程式人生 > >拉勾網招聘資料分析

拉勾網招聘資料分析

背景

大資料概念越來越火爆,很多學生開始學習大資料,社會人士也蠢蠢欲動準備轉行,對這個新興職業充滿期待。在感性背後,我們來理性看待下目前的資料探勘崗位需求,如果您確定要進入資料探勘行業,您要學習哪些知識。本文主要探索的話題為:

  1. 資料探勘崗位市場需求量

  2. 資料探勘崗位誘惑力

  3. 資料探勘崗位對求職者的要求

資料獲取

資料來源:通過爬蟲的方式,從拉鉤網爬取資料探勘頻道下前10頁的招聘崗位,公司,職能要求等相關資料。

詳細資料欄位與內容預覽為:這裡寫圖片描述

資料清洗

• 對薪水欄位的清洗我們將薪水範圍(如15k-20k)清洗成最低薪水,最高薪水,平均薪水三個特徵。在清洗的過程中,我們發現存在著“K”分大小寫的情況,因此,我們優先將字母統一轉化成小寫。

對公司簡介的清洗公司簡介一般由公司屬於行業(如移動網際網路,電子商務)加上公司發展階段(如成熟型)構成。我們將公司簡介欄位清洗成行業+發展階段。此外,我們還對學歷和工作經驗進行拆分

需求現狀

• 說明,未進行時序動態爬取資料,對需求量的變化我們暫且不做描述分析。

• 樣本容量:150

• 在經驗方面,主要為1-5年,佔82%。其中,3-5年工作經驗需求量最大。

• 大資料概念13年底開始火爆,目前的人才要求在經驗上並無特別長的要求,大部分是1-5年。so,如果你想從事大資料,並不晚哦。這裡寫圖片描述

需求現狀- 行業分佈

• 說明:企業可以同屬多個行業,我們在資料處理時,如果一個企業屬於N個行業,我們按照N個企業進行計算。

• 資料探勘在移動網際網路,金融,電商需求量大,傳統行業需求量較少。

• 催生了一批專文做資料服務的企業,這塊需求量也較大。這裡寫圖片描述

需求現狀- 公司發展

• 從公司發展階段來說,各個階段都需求資料探勘崗位,利用資料探勘進行資料驅動。需求分佈比較均勻。這裡寫圖片描述

需求現狀-學歷要求

• 目前資料探勘崗位主要要求本科及以上學歷,大部分都是要求本科學歷,要求碩士學歷的並不多。

• 大專學歷特別優秀也可。這裡寫圖片描述

薪資現狀

  1. 87% 的崗位需求,薪資待遇超過10K.

  2. 平均薪水為 20.51 K,主要集中在10-30K區間段,薪資水平極差為 41.5,薪資水平懸殊較大。這裡寫圖片描述

經驗與薪水之間的關係

• 工作年限越長,薪水越高。工作3年差不多可以達到20K水平,4年差不多25K。

• 資料探勘待遇起點高。剛入門(0年工作經驗)已過10K。2年差不多在20K,和曉哥從網上查到的網際網路公司薪水還是挺吻合的哈。這裡寫圖片描述

學歷與薪水的關係

• 去掉學歷“不限”的樣本後,大專生與本科及以上學歷,在薪水方面差異明顯,讀大學還是有用的哈;本科生平均水平為21.6798246K,研究生為19.7105263K,大專生為10.5384615

• 本科生水平比碩士還高??我們發現本科生水平比碩士高2K;這可能與 1.IT行業本身,本科生已足矣勝任,碩士學歷優勢不夠明顯。2、樣本有篇,工作年限等水平不一致這裡寫圖片描述

看看不同階段的公司,他們給出的待遇水平

• 隨著公司的發展壯大,薪資水平也會組建提升。提升最快的階段當屬初創到成長,企業快速發展時。

• 企業在成長到成熟階段,薪資水平高於其他階段,尤其是成熟(D輪)階段,薪水冠絕整個階段,可能因為這個階段的企業為衝擊上市,高薪招攬良才。在上市後,由於有上市企業這個title作為背書吸引人才,薪水上並不具有絕對吸引力。剛上去與現階段BAT,美團,攜程,餓了麼,滴滴等的情況很符合啊。這裡寫圖片描述

企業的用人要求

• 從詞雲上看,主要要求資料探勘從業者需要掌握程式設計工具,python,R,java,sql等。有相應工作經驗優先。

• 需要熟悉演算法,決策樹,貝葉斯,迴歸等

• 從工作內容上看,主要是使用者行為分析,使用者畫像,建模,製作報告與方案。

• 資料探勘是一門綜合性多學科的職位。既要具有計算機程式設計能力,數學推理能力,還需要和產品等多團隊合作。這裡寫圖片描述

當我們在談論資料探勘時,還會談些什麼?

這裡寫圖片描述

資料科學–工具篇

歡迎預定曉哥整理撰寫的《資料科學-工具篇之R語言》。目錄為:
資料科學-分析篇

  1. R語言入門

  2. R語言基礎資料結構與語法

  3. R語言資料探討

  4. R語言資料處理

  5. R語言高階資料處理

  6. R語言資料視覺化

  7. R語言資料視覺化-互動篇

  8. R語言搭建資料產品

  9. R語言報告自動化

  10. R語言爬蟲

  11. R語言平行計算

資料科學-挖掘篇

  1. R語言迴歸分析

  2. R語言分類預測

  3. R語言聚類分類

  4. R語言時序分析

  5. R語言異常挖掘

  6. R語言文字挖掘入門

  7. R語言複雜網路分析
    預定方式

預定:關注“17找蜜”微信公眾號,留言“預定”加群。

獲取本文資料,關注微信公眾號,留言“招聘資料”獲取本文資料及html互動版這裡寫圖片描述