資料研發面試
阿新 • • 發佈:2018-12-30
阿里:
一面:
1.hive的MapReduce實現過程
2.hive中join的MapReduce過程
3.你在美團有遇到資料傾斜問題嗎,如何解決的
4.實時資料如何保證容錯性的
5.hashmap的實現原理
二面:
1.你在工作中如何處理資料傾斜的
2.distinct和group by的區別
3.假如group by導致資料傾斜,你怎麼處理
4.hadoop和spark的區別有什麼
5.spark streaming的容錯機制
6.相對別人你的優勢是什麼
7.spark的原理
百度:
一面:
1.面向物件的特點,解釋一下重寫、過載、重定義
2.講一下資料庫的四種隔離級別
3.什麼是幻讀
4.棧有入棧和出棧,寫一個函式得到棧的最大元素
5.數學題(連續3個數相乘為什麼一定能被6整除)
因為連續三個數一定有一個數能被2整除,一個數能被3整除
美團:
一面:
1.TCP/IP協議
2.三次和四次握手
3.輸入url後發生了什麼過程
4.不用加號實現兩個數相加
5.linux怎麼每次讀取檔案的最新資料
京東:
一面:
1.傳統資料倉庫和資料庫有什麼不同
2.spark的shuffle階段
3.你關注的新技術
4.給一個連結串列怎麼判斷他是不對稱的
5.給一個數組找出等差數列的個數
6.http協議
7.websocket怎麼確保獲得資料的
8.檢視linux後臺的程序
9.linux的top命令