滴滴大資料面經
地點:西二旗文思海輝
2月11日面試完百度之後,看到手機的未接電話,感覺應該是面試邀約,但是沒有接到,打回去後對方又一直不接,於是秉承著不要臉的精神一直打了5個電話,對方終於接通。接通後簡單的談了一些專案中的問題,又問了問所學的課程,可能是點面試聽到了地鐵站的聲音,面試官就沒有在繼續問下去,說可以約一個面試的時間,當時腦子起泡,直接說可以明天(臘月27面試),面試官說:“好!”。說完後,我就感覺我是瘋了,但是吹過的牛逼,趴著也要做完,於是退票,回學校繼續看書。
2月12日,如約到達滴滴面試地點,中間因為hr弄錯了面試地點,耽誤了一些時間。總體的感覺滴滴的氛圍非常好,是我面試的這幾個公司中特別喜歡的之一,面試官非常友善,
面試開始
(1)自我介紹:這裡我想說的一件事是:一定要突出重點,例如對於網際網路公司來說“加班”、“合作”是兩個非常看重的因素,因為我並不排斥加班,也比較喜歡合作,所以,在自我介紹的時候會用實驗室中做專案的例子來說明自己的想法。比如“合作”,我大概是說,因為實驗室的專案都是與同學、學長合作完成的,我特別喜歡這種工作方式,這樣專案的進度可以非常快速的推進,並且自己也可以學到特別特別多的知識。
(2)講專案:因為在實驗室主要做的是通訊和大資料的專案,滴滴這邊又是大資料的職位,因此將通訊的專案一帶而過,只要講的是大資料的推薦系統的專案。將專案時從背景、任務、完成的要求、原始資料的幾個方面講起。因為專案剛開始做不久,只是完成了一個初步的實現。因此我就從原理開始講起,講完原理後開始將程式碼流程(需要將輸入的資料形式、處理邏輯、輸出的形式一一說明白)。這些講完後,有講了一些特殊的情況,比如新使用者問題、資料稀疏性問題。
接下來,為了拖延一些時間,我引導面試官講了我們整個專案的框架,每一個部分需要處理的問題、每個部分所使用的演算法等。
(3)面試官提問:
1.hadoop提交作業的總體流程
2.hdfs的基本原理
3.hadoop的shuffle過程
4.專案的邏輯出處
5.(大問題)SQL語句自動規範化處理:
答:使用stack的方式處理,識別關鍵字,儲存語句,將SQL語句規範化處理
(4)演算法題目:
1.快排
2.快選
3.歸併排序
4.樹的前序遍歷(非遞迴)
(5)我提問:
1.推薦系統中,係數性的問題如何解決
2.推薦系統中,資料快速增擴,使用工業上的方法應該怎麼處理
3.來這裡我能做些什麼
經過一個多小時的面試非常順利的拿到offer