1. 程式人生 > >資料研發面試

資料研發面試

阿里:

一面:

1.hive的MapReduce實現過程

2.hive中join的MapReduce過程

3.你在美團有遇到資料傾斜問題嗎,如何解決的

4.實時資料如何保證容錯性的

5.hashmap的實現原理

二面:

1.你在工作中如何處理資料傾斜的

2.distinct和group by的區別

3.假如group by導致資料傾斜,你怎麼處理

4.hadoop和spark的區別有什麼

5.spark streaming的容錯機制

6.相對別人你的優勢是什麼

7.spark的原理

百度:

一面:

1.面向物件的特點,解釋一下重寫、過載、重定義

2.講一下資料庫的四種隔離級別

3.什麼是幻讀

4.棧有入棧和出棧,寫一個函式得到棧的最大元素

5.數學題(連續3個數相乘為什麼一定能被6整除)

因為連續三個數一定有一個數能被2整除,一個數能被3整除

美團:

一面:

1.TCP/IP協議

2.三次和四次握手

3.輸入url後發生了什麼過程

4.不用加號實現兩個數相加

5.linux怎麼每次讀取檔案的最新資料

京東:

一面:

1.傳統資料倉庫和資料庫有什麼不同

2.spark的shuffle階段

3.你關注的新技術

4.給一個連結串列怎麼判斷他是不對稱的

5.給一個數組找出等差數列的個數

6.http協議

7.websocket怎麼確保獲得資料的

8.檢視linux後臺的程序

9.linux的top命令