拉勾網招聘資料分析
背景
大資料概念越來越火爆,很多學生開始學習大資料,社會人士也蠢蠢欲動準備轉行,對這個新興職業充滿期待。在感性背後,我們來理性看待下目前的資料探勘崗位需求,如果您確定要進入資料探勘行業,您要學習哪些知識。本文主要探索的話題為:
資料探勘崗位市場需求量
資料探勘崗位誘惑力
資料探勘崗位對求職者的要求
資料獲取
資料來源:通過爬蟲的方式,從拉鉤網爬取資料探勘頻道下前10頁的招聘崗位,公司,職能要求等相關資料。
詳細資料欄位與內容預覽為:
資料清洗
• 對薪水欄位的清洗我們將薪水範圍(如15k-20k)清洗成最低薪水,最高薪水,平均薪水三個特徵。在清洗的過程中,我們發現存在著“K”分大小寫的情況,因此,我們優先將字母統一轉化成小寫。
對公司簡介的清洗公司簡介一般由公司屬於行業(如移動網際網路,電子商務)加上公司發展階段(如成熟型)構成。我們將公司簡介欄位清洗成行業+發展階段。此外,我們還對學歷和工作經驗進行拆分
需求現狀
• 說明,未進行時序動態爬取資料,對需求量的變化我們暫且不做描述分析。
• 樣本容量:150
• 在經驗方面,主要為1-5年,佔82%。其中,3-5年工作經驗需求量最大。
• 大資料概念13年底開始火爆,目前的人才要求在經驗上並無特別長的要求,大部分是1-5年。so,如果你想從事大資料,並不晚哦。
需求現狀- 行業分佈
• 說明:企業可以同屬多個行業,我們在資料處理時,如果一個企業屬於N個行業,我們按照N個企業進行計算。
• 資料探勘在移動網際網路,金融,電商需求量大,傳統行業需求量較少。
• 催生了一批專文做資料服務的企業,這塊需求量也較大。
需求現狀- 公司發展
• 從公司發展階段來說,各個階段都需求資料探勘崗位,利用資料探勘進行資料驅動。需求分佈比較均勻。
需求現狀-學歷要求
• 目前資料探勘崗位主要要求本科及以上學歷,大部分都是要求本科學歷,要求碩士學歷的並不多。
• 大專學歷特別優秀也可。
薪資現狀
87% 的崗位需求,薪資待遇超過10K.
平均薪水為 20.51 K,主要集中在10-30K區間段,薪資水平極差為 41.5,薪資水平懸殊較大。
經驗與薪水之間的關係
• 工作年限越長,薪水越高。工作3年差不多可以達到20K水平,4年差不多25K。
• 資料探勘待遇起點高。剛入門(0年工作經驗)已過10K。2年差不多在20K,和曉哥從網上查到的網際網路公司薪水還是挺吻合的哈。
學歷與薪水的關係
• 去掉學歷“不限”的樣本後,大專生與本科及以上學歷,在薪水方面差異明顯,讀大學還是有用的哈;本科生平均水平為21.6798246K,研究生為19.7105263K,大專生為10.5384615
• 本科生水平比碩士還高??我們發現本科生水平比碩士高2K;這可能與 1.IT行業本身,本科生已足矣勝任,碩士學歷優勢不夠明顯。2、樣本有篇,工作年限等水平不一致
看看不同階段的公司,他們給出的待遇水平
• 隨著公司的發展壯大,薪資水平也會組建提升。提升最快的階段當屬初創到成長,企業快速發展時。
• 企業在成長到成熟階段,薪資水平高於其他階段,尤其是成熟(D輪)階段,薪水冠絕整個階段,可能因為這個階段的企業為衝擊上市,高薪招攬良才。在上市後,由於有上市企業這個title作為背書吸引人才,薪水上並不具有絕對吸引力。剛上去與現階段BAT,美團,攜程,餓了麼,滴滴等的情況很符合啊。
企業的用人要求
• 從詞雲上看,主要要求資料探勘從業者需要掌握程式設計工具,python,R,java,sql等。有相應工作經驗優先。
• 需要熟悉演算法,決策樹,貝葉斯,迴歸等
• 從工作內容上看,主要是使用者行為分析,使用者畫像,建模,製作報告與方案。
• 資料探勘是一門綜合性多學科的職位。既要具有計算機程式設計能力,數學推理能力,還需要和產品等多團隊合作。
當我們在談論資料探勘時,還會談些什麼?
資料科學–工具篇
歡迎預定曉哥整理撰寫的《資料科學-工具篇之R語言》。目錄為:
資料科學-分析篇
R語言入門
R語言基礎資料結構與語法
R語言資料探討
R語言資料處理
R語言高階資料處理
R語言資料視覺化
R語言資料視覺化-互動篇
R語言搭建資料產品
R語言報告自動化
R語言爬蟲
R語言平行計算
資料科學-挖掘篇
R語言迴歸分析
R語言分類預測
R語言聚類分類
R語言時序分析
R語言異常挖掘
R語言文字挖掘入門
R語言複雜網路分析
預定方式
預定:關注“17找蜜”微信公眾號,留言“預定”加群。
獲取本文資料,關注微信公眾號,留言“招聘資料”獲取本文資料及html互動版