1. 程式人生 > >一線網際網路公司機器學習崗位面試經驗

一線網際網路公司機器學習崗位面試經驗

從9月18號開始投實習簡歷到10月21號,差不多一個月的時間,面了三個網際網路公司,有研發崗和演算法崗,有的拿到了internship, 也有的被慘虐;會有面試通過的驚喜,也有一輪遊的不甘;對結果的無法控制和等待過程中的焦慮,更會有對自身的不自信,相信每個面試的人都經歷過,但無論如何實習這件事算是過去了,希望自己在接下來的路依舊不卑不亢,努力前行。

一、 某度內容推薦平臺架構崗面試總結(拿到internship)
時間:9月18號–9月28號
由於有玩的不錯的同學騰二在這家公司,於是就直接內推了,從投遞簡歷到三面結束共10天,不得不說其效率還是挺高的。其實本想是和騰二一樣做web開發崗,當時面試準備的也是和web開發相關的,但由於之前沒咋做過專案,servlet、session等知識不會,就被轉到推薦平臺架構設計崗了,最終通過面試,也是挺幸運的。下面總結下面試內容:

  • 一面:
    一面是個姐姐,之前聽騰二說它的部門經理是學姐,然後我就以為是她,就一個勁稱呼她學姐,可惜後來才知道不是。她問的比較基礎,建議大家要熟悉考研408的知識,這樣至少不會一輪遊。
    1. 介紹專案
      參加過天池大資料競賽,所以這個問的比較細,這個比賽前前後後被問了有四次。雖然感覺一次比一次表述的好一些,但還是缺乏有力的總結,比如為什麼用RF模型,這個模型比別的好在哪裡,適用場景有哪些,優缺點是啥;特徵工程的時候,為什麼要這樣處理,這樣處理有什麼好處;你自己的創新點在哪裡?總而言之就是細節一定要把握好,多問問自己那塊為什麼這樣做,針對可能會被問到的問題都準備下。
    2. 資料庫知識
      由於自己學過慕課網的資料庫實戰專案課程,對mysql有一定的瞭解,故在簡歷中刻意提到了這些。mysql資料庫的索引優化,sql優化,常用sql語句的書寫也要懂(巢狀的,稍微複雜些的也要會),熟悉下較流行的資料庫,比如memcache,redis等。(主從複製原理也要懂,,多執行緒訪問資料庫)
    3. 網路
      tcp協議三次握手四次揮手,http協議包含哪些請求,tcp對應協議,udp對應協議
    4. 程式語言
      java的hashMap、hashTable等必問題,java虛擬機器的GC回收演算法,和C/C++區別等等
    5. 資料結構
      兩個程式設計題,判斷單鏈表有沒有環,並輸出第一個環節點;找兩個連結串列的公共節點。

總體來說,一面不是很難,這些需要大家有目的性的積累。

  • 二面
    二面是個男的,具體職位不清楚,但感覺比較難,個人面完後覺得要跪。問的網路方面的東西比較多,涉及到的原理性知識也偏多了些。
  1. 專案:

    各種細節吧,每個人關注的點不一樣,所以還是要把專案屢清楚,創新點、邏輯、多問幾個為什麼等等。
    還問了我如何處理負載均衡,我回答的不好。

  2. 網路:

    瀏覽器輸入www.baidu.com會發生什麼?(說的越詳細越好),這個問題可以看出一個人對網路的熟悉程度,根據這個問題,牽扯到了許多,比如常見路由選擇協議及底層原理,ARP/RARP協議,html介面如何返回,servlet /session等等,由於這些我之前不太瞭解,感覺面的很差。

  3. 資料結構:

    就一個,全排列演算法

  4. 程式語言:

java必問的那些,GC演算法,多執行緒(最好有多執行緒專案,會是亮點

二面完個人感覺很差,因為網路那塊的知識感覺被虐慘了,但是資料結構方面問的其實不難,感覺複習的時候複習到樹那塊的知識就足夠了。演算法部分推薦大家看july的《程式設計之法》,不多,很系統。

  • 三面

三面基本上沒有問技術,問了兩個智力題,然後就問了下實習時間,介紹了下他們做的內容,以及自己要去的話會做啥等等。但是由於自己的時間問題,不能滿足他們實習6個月的要求,所以很遺憾,最終沒能去成。

二 、某一線網際網路機器學習崗面試總結(一輪遊)

機器學習崗還是很有挑戰性性的,對機器學習演算法理論要求比較高。這次面試主要圍繞兩個大資料競賽,問了很多比賽中模型的細節,穿插著問了常用的分類、聚類模型原理、適用場景等問題。由於是第一次面演算法崗,理論部分準備的不是特別充分,導致一輪被掛,沒有覺得遺憾。以下是建議:

對常用模型要有熟悉的理解,從理論到應用,從推導公式,到深入理解,一個環節都不能少。要熟悉的理論知識:決策樹、貝葉斯、邏輯迴歸、RF、GBDT、xgboost、KNN、k-means、adboost,甚至正則項L0、L1、L2的作用。

下面說說面試中被問到的:

  • 決策樹:資訊增益、資訊增益率、GINI係數。

    資訊增益用來度量屬性劃分樣本的能力,資訊增益越大,樹的劃分情況越好,越簡潔,高度越低。

    資訊增益率:資訊增益比上分裂資訊熵,為了解決資訊增益作為衡量指標的一個缺點(參考jiawei han那本書)

    gini係數:用來度量分佈不均勻性(不純),總的類別越雜亂,gini指數越大,所以要找最小gini指標。
    貝葉斯:貝葉斯原理,樸素貝葉斯。

    注意若某屬性A是連續值的情況,gini係數和資訊增益都如何處理。

  • 貝葉斯定理:

    樸素貝葉斯: 掌握某屬性是連續值情況如何處理(高斯分佈),遇到0概率值怎麼辦(拉普拉斯校準)。若屬性之間不是相互獨立的怎麼辦?(貝葉斯網路)

  • k-means缺陷,knn如何制定k,kd樹原理。

三 、某小公司機器學習崗面試總結(internship)

這家面的是一家小公司,由於不是前兩場電話面試,而是face-to-face,所以問的更具體一些。

主要還是問了天池的競賽,不過又細化到了python下scikit-learn包API如何呼叫、引數如何設定等問題,當然RF等模型原理還是少不了問的,還問了模型的輸入和輸出等。日後我會整理出一篇關於天池競賽思路的部落格,以便下次面試使用。還有C++的多繼承的缺點,java為什麼要有介面。剩下的就是白板面試,現場寫演算法。總而言之,face-to-face問的更細,問的也最久,雖然是小公司,但是面試壓力還是挺大的。

最後,祝願大家能夠不斷努力,證明自己,找到自己喜歡的崗位。

相關推薦

一線網際網路公司機器學習崗位面試經驗

從9月18號開始投實習簡歷到10月21號,差不多一個月的時間,面了三個網際網路公司,有研發崗和演算法崗,有的拿到了internship, 也有的被慘虐;會有面試通過的驚喜,也有一輪遊的不甘;對結果的無法控制和等待過程中的焦慮,更會有對自身的不自信,相信每個面試

前端跳槽必備 揭祕一線網際網路公司高階前端JavaScript面試

4-1 開始 4-2 單執行緒 - 介紹-1 4-3 單執行緒 - 介紹-2 4-4 單執行緒 - 非同步-1 4-5 單執行緒 - 非同步-2 4-6 單執行緒 - 總結 4-7 event-loop - 演示 4-8 event-loop - 程式碼演示 4-9 event

機器學習崗位面試問題彙總 之 SVM

自己結合網路、書本內容總結,歡迎指正歡迎補充。 更新日期:20170607—版本1 1.簡述SVM 二分類模型、更嚴格優化條件—>更好分界線,低維—->高維,間隔最大的分割平面,不太容

機器學習崗位面試問題匯總 之 深度學習

ini 生成模型 其中 推導 中產 2-2 聯系 相同 扭曲 自己結合網絡內容總結,歡迎指正歡迎補充。 最新更新:20170624—版本2(增加22-28) 1.模式識別、機器學習、深度學習的區別與聯系 模式識別:過去、程序/機器做智能的事、決策樹等 機器學習:熱點領域、給

機器學習崗位面試總結:簡歷應該關注的5個重點

機器學習簡歷的一些小技巧 如今的公司很難找到優秀的機器學習人才。當然,任何特定技能的要求都取決於機器學習專案的用途和要求,但是您的機器學習履歷中必須具備的某些技能在各種專案要求中是一致的。 通常,公司希望面試者具備豐富的機器學習技能,理論和編碼能力,以便在需要時能夠跨部門參與機器學習專案。該領域的專家不僅

大資料開發崗位面試經驗總結(一線、二線,獨角獸,外企,外國企業)

為什麼想走? 跟很多人也許不同,我這裡並不是待遇問題,反而認為現在公司在網際網路公司中的待遇算一股清流了:額外家屬子女商業保險、總包17薪、出國團建、加班少、工作氛圍愉快,沒有所謂大公司政治鬥爭,這些對於我畢業第一份工作已經非常滿意。之所以決定離開,主要源於個人

一線網際網路公司必備——最為詳細的Docker入門吐血總結

“ 在計算機技術日新月異的今天, Docker 在國內發展的如火如荼。 特別是在一線網際網路公司 Docker 的使用是十分普遍的,甚至成為了一些企業面試的加分項,不信的話看看下面這張圖。 這是我在某招聘網站上看到的招聘 Java 開發工程師的招聘要求,其中有一條熟悉 Doc

網際網路金融-機器學習及評分卡構建

金融的核心是什麼? 嚴謹的金融從業者,答案必是風控。 金融的核心是風控,風控的核心,是模型。 風控是金融業務的核心組成部分,而信貸風控又是整個風控領域體量最大、挑戰最大的型別。傳統的信貸風控主要靠資深從業人員依靠自身的經驗設定的專家規則。 市場越亂,渾水摸魚者越多,風控行業就

BAT等一線網際網路公司中,Java開發的招聘標準

我總結了進入這三家公司你所需掌握的技能: 阿里巴巴篇 紮實的計算機專業基礎,包括演算法和資料結構,作業系統,計算機網路,計算機體系結構,資料庫等 具有紮實的Java程式設計基礎,理解IO、多執行緒等基礎框架 熟練使用Linux系統的常用命令及shell有一定了解 精通多執行緒程式

程式設計師在論壇裡炫耀公司待遇,一線網際網路公司員工直接晒出下午茶

雖然現在人們的生活水平上來了,但是生活壓力也越來越大,工作上的強度也越來越多,而且很多工作都是要講究效率的,有一些比較人性化的單位,為了能夠減輕員工的工作壓力,會從很多方面保障員工的工作動力。     為員工創造屬於自己的食堂,也算是一種方法,現在很多單位為了做

機器學習筆試面試題目 二

1、使用k=1的knn演算法, 下圖二類分類問題, “+” 和 “o” 分別代表兩個類, 那麼, 用僅拿出一個測試樣本的交叉驗證方法, 交叉驗證的錯誤率是多少: A 0% B 100% C 0%到100 D  以上都不是 正確答案是: B 解析: knn演

2018年一線網際網路公司Java高階面試題總結

1、hashcode相等兩個類一定相等嗎?equals呢?相反呢? 2、介紹一下集合框架? 3、hashmap hastable 底層實現什麼區別?hashtable和concurrenthashtable呢? 4、hashmap和treemap什麼區別?低層資料結構是

國內一線網際網路公司年終獎發放,你知道嗎?

年將盡,我們即將迎來年終獎,同時也預示著年後跳槽季的到來,這裡小編就給大家收集了一些知名網際網路公司的年終福利,大家提前有所瞭解,方便年後做出選擇。——記得要認真看完哦!   百度 Offer 上寫得是 14.6 個月薪水,年中發 0.6 個月,年底發 2 個月,年終獎是要算

機器學習筆試面試超詳細總結(二)

51、概率和資訊量的關係 示例: 符號集 a 、 b 、 c 、 d ,它們相互獨立,相應概率為 1/2 、 1/4 、 1/8/ 、 1/16 ,其中包含資訊量最小的符號(a) 解析: 訊息出現的概率越小,說明限制條件越多,則訊息中所包含的資訊量就越大;

百度機器學習實習面試經歷

一面: 上來應該先看的是專案。我專案裡有一個關於無監督聚類的研究,他問了一下有監督和無監督的區別,我的回答他應該不滿意。 接下來問的是程式語言,問主要問C和C++,比如C++的virtual關鍵字,C的friend關鍵字,inline關鍵字的作用和具體是怎麼實現的,這一塊C

PMML模型檔案在機器學習的實踐經驗

這種方案,在本次參加 QCon 大會時,Paypal的機器學習平臺中也有所提及: PMML 預測模型標記語言(Predictive Model Markup Language,PMML)是一種可以呈現預測分析模型的事實標準語言。標準東西的好處就是,各種開發語言都可以使用

[轉載]知名網際網路公司 Java 開發崗面試知識點解析

天之道,損有餘而補不足,是故虛勝實,不足勝有餘。如背景中介紹,作者在一年之內參加過多場面試,應聘崗位均為 Java 開發方向。在不斷的面試中,分類總結了 Java 開發崗位面試中的一些知識點。主要包括以下幾個部分:Java 基礎知識點Java 常見集合高併

android國內一線網際網路公司內部面試題庫

以下面試題來自於百度、小米、樂視、美團、58、獵豹、360、新浪、搜狐內部題庫 熟悉本文中列出的知識點會大大增加通過前兩輪技術面試的機率。 一、java基礎 1.介面的意義(百度) 規範、擴充套件、回撥 2.抽象類的意義(樂視) 為其子類提供一個公共的型別 封裝子類中得重

想進一線網際網路公司的應屆生注意啦~2018 屆校招的情況有些變化

全文 3300 多字,時間比較緊張的同學可以直接讀標題 文末有簡尋利益相關,沒有需要的同學略過就好~~但正文木影響~~ 資本寒冬還在繼續,裁員正在成為 2016 年的行業主題。 隨著開學季,各高校的正式秋招即將開始,網際網路領域的校招形勢如何? 雖然各一線網際網路公司早從 7 月就開始了聲勢浩大的內推和校招