大資料工程師面試
技術成熟
大資料實踐不夠
大資料大於資料分析
大資料人才企業培養的
核心技能
大資料團隊構成 基礎平臺、應用平臺、資料應用(使用者畫像、BI、使用者行為分析)
大資料開發工程師 精通各個元件的原理。理解業務的需求,java,scala,hive
資料倉庫工程師 資料建模,java,hive,python
演算法工程師 機器學習演算法,使用者畫像,推薦,
100PB
數十萬
幾千個節點
面試準備
個人角色的定位
大資料開發工程師
個人職業規劃 2-3年 業務、技術、綜合能力 微調
紮實的基本功 面試的時候要複習 資料結構,Linux,專案管理,開發流程
開發語言 最擅長 兩個,深入到原理 java, python
公司、專案的回顧以及梳理 核心專案梳理清楚 跟求職崗位相關的重點回顧
業務細節要重視
專案梳理步驟:專案背景、專案設計以及架構、技術選型以及對比、實現的細節、專案的效果
簡歷的準備 簡歷的內容最好不要超過兩頁,掌握的內容不求全而求精
寫真正擅長的,業務與技術、專案要突出重點 與求職崗位相關的重點描述
面試技巧
技術面(基本功、技術深度),業務專案面(通過不同專案考核技術的廣度,以及實踐能力),綜合能力面(執行能力,溝通能力,協調能力)、HR面(求職意願、穩定性,抗壓性)
面試要點 常見考核點
Hadoop工程師 元件精通程度,精讀面試相關元件的程式碼,並能針對各種應用中遇到的問題快速定位,java是基礎。linux基礎,然後精通某些元件
&&叢集規模變大,檔案數增多,node記憶體受限成為瓶頸,如何解決。 node水平擴充套件
敏感資料的安全保護措施 伺服器訪問認證,底層目錄許可權管理、hive表的許可權管理、三層結合達到目標
hadoop實戰,java核心技術
大資料開發工程師
面試要點
熟練使用相關的元件,針對各個元件在應用中的不同環節進行調優,能夠充分發揮大資料的價值,不同元件有變化,java scala是常見的開發語言 hbase mapreduce storm
hbase rowkey如何設計 結合實際的專案
如何實現map reduce spout bolt
storm併發問題 容災策略
資料倉庫工程師
面試要點
熟悉各個元件,資料建模,資料分層模型,ETL流程,資料質量,資料安全相關知識
hive構建,相關元件mapreduce spark hivesql
hive mr開發的時候 資料傾斜怎麼辦, 怎麼去優化,怎麼去分析
資料建模常用的方法和模型 資料倉庫建設的優點,解決了哪些痛點,數倉規劃 模型設計
日誌系統的ETL環節 具體每一步都做了那些事情 資料質量是如何保證的
資料分析師
sql基礎 hivesql python 資料分析專案的流程 採集、整理、資料建模、分析、報告的產生、行業相關的指標定義
指標體系 分別是怎麼定義的
演算法工程師
演算法理論知識、工程實現能力和編碼水平,業務的理解能力和思考的深度
統計學 數學基礎知識 矩陣變換、特徵值
演算法方面 各種常見的機器學習演算法的原理和區別,常用調優的方法
資料結構、搜尋方法
推導,原理,廣告點選的預估,用了哪些資料,那些演算法實現的
大資料職業發展通道,進階之路
叢集規模、公司的業務模式 職業發展的瓶頸
技術路線 管理 技術型管理
迷茫期 重複工作 差異變化小 沒有職業規劃
30-40歲 黃金階段 業務範圍擴張計劃、技術廣度深度提升計劃、溝通協調,綜合能力
1、開發語言問題 不同崗位對語言要求不一樣 明確的角色定位,然後再掌握語言
2、轉崗轉行 2-3年職業規劃
3、學歷問題 簡歷要求匹配。都會給面試機會
4、自學&培訓班 不是很重要,影響不大,看中之前的技能,和之前的專案是否相關或者匹配