一些演算法崗的校招面經
從今年3月份暑期實習到秋招一直投的演算法崗(資料探勘、機器學習),今年聽說投演算法的人特別多,競爭激烈,自己之前本來想去金融,後來覺得還是喜歡網際網路,從去年11月才開始好好看書,又不是CS科班出身,所以面試毫無優勢可言。基本上把大半個網際網路公司都面了一遍,雖然掛的太多,但面試官水平都很高,面試中也學到了很多東西,認識到很多地方不足,要學的東西太多。
有的時間太久,細節想不起來了,想起來再慢慢更新,把不知道的知識點補上,寫的亂湊合著看
攜程(實習):
1. 講專案
2. 寫一下LR損失函式
3. SQL題,很簡單,但當時沒想出來…
4. GBDT、xgboost用過嗎,解釋一下
5. 距離公式有哪些(餘弦距離等)
6. 特徵怎麼選擇
7. 隨機森林
8. 優化BFGS瞭解嗎
滴滴(實習+校招):
過完年回來,參加映像最深刻的實習面試,全程3小時,其實問的很基礎,但是自己沒有好好準備,很多基礎掌握不牢。
1. 講專案
2. SQL:leftjoin、inner join區別,寫了一道題
3. SVM是什麼、核函式有哪些、怎麼選擇
4. LR損失函式推導一下
5. 隨機森林、Adboost
6. AUC、ROC、recall、precision寫公式,AUC的直觀解釋
7. CNN的卷積公式
8. 損失函式不可導,梯度下降法怎麼辦?(次梯度?)
9. Python中list和tuple的區別
10. 正負樣本不平衡怎麼辦
11. 決策樹怎麼剪枝
12. 問了些資料結構
校招(沒面完):
1. 寫個快排、改進、find(s,p),寫了4道程式碼題
2. 200G日誌用筆記本找Top100的query
3. 解釋一下xgboost
4. 講專案,用到了哪些特徵
阿里(實習+校招)
內推的螞蟻的風控部門
一面:
1. 7月底就打了電話,主要是講專案,然後針對專案提了很多問題,面試官水平很高
2. 資料樣本構造、樣本選取
3. 講了word2vec以及怎麼應用
4. 看過什麼前沿的論文
5. 垃圾評論檢測
二面(掛):
1. 聊專案
2. 文字相似度計算為什麼不用SVD…
3. 瞭解哪些優化演算法
騰訊(實習+校招)
實習做了筆試,邀請到酒店面試,是一個小哥,很和藹
1. 自我介紹,講了一個專案
2. Xgboost、隨機森林的區別,xgboost怎麼並行
3. L1、L2正則化的區別,為什麼L1得到稀疏解
4. 解釋一下SGD、drop_out、神經網路的BN層
5. 程式碼題:最長子序列的乘積
(第二天查了狀態是複試中,但到最後也沒收到複試通知,最後一天查狀態掛了…)
秋招內推,騰訊遊戲的部門
一面(視訊面,全程寫程式碼)
1. 寫LR公式
2. DNN前向傳播、反向傳播,求梯度
3. 實現一下shuffle函式
4. 瞭解強化學習、增強對抗學習嗎(不瞭解)
二面(掛):
1. 講專案
2. K-means、隨機森林、DNN怎麼調參
3. 怎麼防止過擬合
4. C++記憶體怎麼分配(說不知道,直接跪)
5. 寫C字串拷貝函式strcpy
6. 寫判斷是否二叉排序樹
美團(校招)
1. 推薦演算法:SVD、協同過濾等,怎麼做推薦的
2. 解釋一下CNN、RNN
3. 資料怎麼處理、特種工程
4. 特徵選擇怎麼做、決策樹怎麼分裂的
5. 推薦系統好壞評價
6. 解釋一下AB測試
7. 提高外賣配送效率,需要考慮哪些因素
8. 樣本怎麼構造、資料量有多大
9. 餘弦距離和歐氏距離區別
10. 評論反作弊(被問了不下於3次)
京東(實習+校招)
校招投的上海這邊演算法組,面了兩面說對我很滿意,要給部門老大看,但不一定有offer,因為老大手上簡歷太多…
1. 講專案,特別是衡量指標
2. 怎麼做推薦的
3. 決策時、GBDT、Xgboost講一下區別
4. Sql題:怎麼用join實現分組排序和分組累加和
5. 問了專案的word2vec和doc2vec演算法、問了推薦怎麼做的
6. LSTM和RNN區別
百度(校招)
先是內推,面完3面後很久沒收到訊息,就知道掛了
一面:
1. xgboost與GBDT比較
2. Python中numpy為什麼快,說用的C實現,然後問C++中STL底層,完全不會
3. Python中能表示的最大數
4. 怎麼做推薦、文字處理方法
5. 寫程式碼:求兩個字串的最小編輯距離
二面:
1. CNN怎麼做文字分類
2. 怎樣快速計算x的根號3次方,有記憶體限制,不能調庫函式(這個問題糾結了很久)
三面:
經理面,從技術到人生都問了很多
1. 寫個程式碼,求兩個有序陣列的交集,O(n),沒想出來,只想出了一個二分查詢
2. 協同過濾
3. 開放題,輸入一個劉,彈出劉德華之類的,怎麼做
校招霸面:
二面是百度鳳巢的,感覺水平很高,答的不好,掛了
1. 資訊熵、資訊增益、相對熵、交叉熵、互資訊、基尼係數
2. 常用的有哪些損失函式,推導一下log loss的梯度
3. 寫個程式碼:快速排序,平均時間複雜度、最壞情況
4. 怎樣確定取樣的樣本數量
5. 特徵工程怎麼做
6. 特徵值、特徵向量解釋一下
7. 解釋一下決策樹、隨機森林
8. 推薦系統考慮的因素特徵
9. 路徑優化考慮哪些因素
10. 寫個程式碼:字串去重函式
愛奇藝(校招)
1. 寫個二叉樹反轉
2. 資訊熵公式
3. CNN卷積的物理含義、pooling的作用
4. 畫一下word2vec中的skip-gram模式圖
5. 概率題:54張抽出2張同花色的概率,大小王任意一種花色都不算
還面了華為、唯品會之類的,基本都是聊專案,所以沒什麼好寫的,後面想起了再更新