百度大資料實習生電話面試總結
剛面完百度大資料實習生職位,還熱乎的,這樣我第一次面試獻給了百度,感覺面試官很nice,聽聲音年齡不到三十,問的問題好多都是探討講,這中間還會提示一些。進BAT任何一家實習一直是我特別嚮往的,下面為我以後更好發揮做個總結,同時也為準備去百度的小夥伴提供參考,希望我出現的問題你們不要在出現。
昨天中午接到百度HR的通知,今天下午兩點有電話面試,準備時間只有一天,時間比較緊張,我想的是HR既然看的我簡歷來面試我的,那麼我要把簡歷上的東西捋一捋(切記簡歷一定要真實,不要吹牛逼,哎,說多了都是淚。。。)。網上說百度會問資料結構和演算法之類的,也把資料結構主要演算法看了一遍,盯著時間從1點50到了2點,應了那句話,最緊張的不是考試,而是等待考試的到來。不廢話了,言歸正傳。
1. 介紹下自己
簡單說了自己研究生做的專案,本科時候獲的獎勵
2. 問簡歷上專案
我簡歷上寫了兩個專案,一是研一時候過的一個Java專案,二是自己實驗室做的關於Hadoop的實驗。面試官重點問了第二個專案,應該是因為和職位相關吧
(1)問了二次排序原理,這個在我簡歷上寫了的,用語言表達確實不容易表達,/(ㄒoㄒ)/~~回答的不太好,如果現場面試畫個圖會更好些
(2)由於我描述的不太清,他就讓我介紹下wordcount基本原理,balabala說了一通,面試官說介紹的還可以(竊喜)
(3)講講mapreduce配置優化
(4)一個實際問題:mapreduce程式,reduce階段,key聚集到一塊兒怎麼處理?
(5)另一個實際問題:寫一個統計pv訪問次數的程式,輸入檔案有兩列:一列url,一列pv訪問次數(這個程式類似於wordcount統計程式)
(6)上個問題升級版,如果這個檔案有三列:加一列cookie,統計去重後地址訪問次數(同一個地址訪問,cookie值一樣的算是一次),我回答需要自定義個數據型別來做,面試官引導我:先給檔案分割槽,然後在去重。最後也沒表達出面試官提示的方法。
3. 資料庫方面
問了left join、right join、inner join 沒回答好,自己在簡歷上寫的熟練掌握資料庫(作死的節奏啊o(╯□╰)o)
4. “問個簡單的資料結構演算法吧”
面試官原話,不過確實挺簡單的,只問了快速排序原理及複雜度,複雜度答錯了,好悲催
5. 問我對職位還有什麼問題
這次面試過程還是蠻輕鬆,比我想象要簡單,可是自己並沒有回答的很好,以後需要加強的地方:
1.簡歷一定要實事求是,切忌浮誇
2.面試必不可少資料結構,資料結構必不可少快速排序演算法
面試官最後說讓我等通知,自己被pass掉也正常,能進去算是自己撞大運了,不管什麼結果,再接再厲!