1. 程式人生 > >記搜狗機器學習實習生面試

記搜狗機器學習實習生面試

1.面試經過
面試兩點開始,面試的工作人員拿來我的簡歷挑著上面的演算法開始問,首先問到的是決策樹演算法,我回答到了熵,資訊增益,特徵選擇以及決策樹演算法的幾個步驟,接著他問我決策樹如何剪枝,我回答了在訓練的時候可以設定它的深度,他接著問如果樹已經訓練好了,該怎麼剪枝,這個我不太明確,當時就扯了一下,說用交叉驗證來比較一下沒有修剪的決策樹與剪掉部分葉子節點的決策樹的預測精確率和召回率來確定該剪掉哪些葉子節點;
然後就進入下一個演算法了,他看到我的簡歷上有一個用貝葉斯做文字分類的專案,就讓我談一下貝葉斯演算法,我首先說了一下貝葉斯演算法的基本理論,怎麼指導著文字分類的,接著談了一下自己做文字分類的流程,感覺答的還不錯。然後問了為什麼選擇貝葉斯做文字分類,分類演算法不是有很多嗎?你覺得用貝葉斯做這個的優點是什麼,為什麼不選用別的演算法。。。蒙圈。。。
下一個演算法是SVM,讓我說一下SVM,推一下目標函式。
隨機森林,解釋一下隨機森林是怎麼個原理,然後針對自己簡歷上的一個專案怎麼進行特徵提取,當時就回答了兩點:1.有專門的人進行特徵篩選 2.根據隨機森林預測的模型中的每個特徵貢獻值的大小進行特徵提取,分別提取前100或200的特徵,然後再跑,比較。
最後問了一下神經網路的前向傳播和反向反饋。
關於機器學習演算法,總體來說不難,因為沒有問得特別深,感覺機器學習目前公司要求的水平還是側重於簡單原理的理解,感覺更重要的是特徵工程和每個演算法的使用場景的差異。


演算法問完了,之後就是程式設計了,對於兩年沒有刷過題的自己來說簡直想說:不要,不要過來。。。第一道演算法題是給一個m*n的0,1矩陣,讓找出裡面最大的全1矩陣,說完題目,他就出去了,好吧,我不會,想了幾分鐘,感覺暴力的方法肯定時間複雜度達不到他的要求,怎麼做了,我拿出了手機開始搜,果然有,不過人家的程式碼我看不懂啊,心累,想放棄了,心裡鬥爭了好久,繼續看人家的程式碼,看不懂。過了好一會兒,他進來了,看見我查手機了,我坦白告訴他我不會,然後他給我換了一道簡單一點的題,連結串列轉置,我剛開始的思路是用到了資料結構-棧,結構他說不需要額外佔用儲存空間或者佔用很少的儲存空間,然後我想了半天,發現可以定義兩個變數就行,告訴他思路,他讓把程式碼寫出來,寫出來了。只想說,程式設計題佔用時間太久,對於程式設計,我真的是菜鳥。
最後他列印了兩張試卷,第一張是選擇題,第二張是一個大題,他說他來得有點晚,時間不夠用,然後就只讓我做最後的那個大題。題目是這樣的:提供1000首歌曲,並且這些歌曲在豆瓣上都有相應的評分,讓你根據評分來設計一個隨機演算法讓評分高的音樂抽到的概率大(概率與評分對應)

相關推薦

機器學習實習生面試

1.面試經過 面試兩點開始,面試的工作人員拿來我的簡歷挑著上面的演算法開始問,首先問到的是決策樹演算法,我回答到了熵,資訊增益,特徵選擇以及決策樹演算法的幾個步驟,接著他問我決策樹如何剪枝,我回答了在訓練的時候可以設定它的深度,他接著問如果樹已經訓練好

機器學習筆試面試題目 二

1、使用k=1的knn演算法, 下圖二類分類問題, “+” 和 “o” 分別代表兩個類, 那麼, 用僅拿出一個測試樣本的交叉驗證方法, 交叉驗證的錯誤率是多少: A 0% B 100% C 0%到100 D  以上都不是 正確答案是: B 解析: knn演

利用python抓取指數學習筆記

1.搜狗指數 強調下:搜狗指數抓取真的很簡單、很簡單、很簡單,大家一定不要被嚇到,哈哈哈哈。 搜狗指數是一個指數指標,能夠反應出來每天人們搜尋的趨向,每天都有搜尋變化表以及隨機搜尋內容。 本來打算爬取百度指數,但是百度的反爬蟲做的很好,均要解析圖片,因此先以搜狗進行學習

機器學習筆試面試超詳細總結(二)

51、概率和資訊量的關係 示例: 符號集 a 、 b 、 c 、 d ,它們相互獨立,相應概率為 1/2 、 1/4 、 1/8/ 、 1/16 ,其中包含資訊量最小的符號(a) 解析: 訊息出現的概率越小,說明限制條件越多,則訊息中所包含的資訊量就越大;

百度機器學習實習面試經歷

一面: 上來應該先看的是專案。我專案裡有一個關於無監督聚類的研究,他問了一下有監督和無監督的區別,我的回答他應該不滿意。 接下來問的是程式語言,問主要問C和C++,比如C++的virtual關鍵字,C的friend關鍵字,inline關鍵字的作用和具體是怎麼實現的,這一塊C

一線網際網路公司機器學習崗位面試經驗

從9月18號開始投實習簡歷到10月21號,差不多一個月的時間,面了三個網際網路公司,有研發崗和演算法崗,有的拿到了internship, 也有的被慘虐;會有面試通過的驚喜,也有一輪遊的不甘;對結果的無法控制和等待過程中的焦慮,更會有對自身的不自信,相信每個面試

資料探勘(機器學習面試--SVM面試常考問題

應聘資料探勘工程師或機器學習工程師,面試官經常會考量面試者對SVM的理解。 以下是我自己在準備面試過程中,基於個人理解,總結的一些SVM面試常考問題(想到會再更新),如有錯漏,請批評指正。(大神請忽視) 轉載請註明出處:blog.csdn.net/szlcw1 SVM的原

百度 鳳巢 機器學習實習生面經

今天去了西二旗百度 一面問題:自我介紹,講一下簡歷專案, 重點問最近鄰棧的演算法,從紙上寫出來 a) push() 把元素a放到棧的最頂層 b) 獲得第i個元素,然後把第i個元素放到棧頂。 然後刪除第i個元素  c) 刪除棧頂的元素  面試官問我是不是很長時間沒寫程式碼了

滴滴機器學習工程師面試總結

        非常感謝滴滴給了我非常多次面試機會,也由衷地佩服滴滴面試官的素質,希望大家不要再黑滴滴了。         也不知自己為什麼這麼有勇氣,投遍了大廠的演算法,然而最近的狀態一直是做筆試,做測評,跑面試,什麼公司都投,像趕場一樣四處跑面試,真替自己心酸,仔細想一

機器學習崗位面試問題彙總 之 SVM

自己結合網路、書本內容總結,歡迎指正歡迎補充。 更新日期:20170607—版本1 1.簡述SVM 二分類模型、更嚴格優化條件—>更好分界線,低維—->高維,間隔最大的分割平面,不太容

2016校招百度美團360機器學習面試經歷

機器學習崗位 原文地址:http://blog.csdn.net/u014365862/article/details/50889976 今天下午在教室自習,順便還投了一些公司,準備筆試面試,突然接到百度hr的電話,順利拿到offer。期間,我有點屌絲地反覆問她這個of

機器學習崗位面試問題匯總 之 深度學習

ini 生成模型 其中 推導 中產 2-2 聯系 相同 扭曲 自己結合網絡內容總結,歡迎指正歡迎補充。 最新更新:20170624—版本2(增加22-28) 1.模式識別、機器學習、深度學習的區別與聯系 模式識別:過去、程序/機器做智能的事、決策樹等 機器學習:熱點領域、給

2019華為機器學習實習面試

第一次面試,還是留點做一下總結。剛開始收到可以投華為實習的訊息就去試了一試,沒抱多大希望,因為投的是機器學習的實習生。我專業是EE相關而不是CS,而且還在本科三年級階段,所以這次實習投得算比較頭鐵的了,但不管怎麼樣還是選擇去試了一試。一些禮節性的就跳過了,下面是過程:1.沒有

微軟OpenHack機器學習挑戰賽

  有幸參加了微軟OpenHack挑戰賽,雖然題目難度不大,但是很有意思,學到了很多東西,還有幸認識了微軟樑健老師,謝謝您的幫助!同時還認識同行的很多朋友,非常高興,把這段難忘的比賽記錄一下~~也分享一下程式碼,給那些沒有參加的朋友, 資料集(文末連結) 首先每支隊伍會收到一個數據集,它是一個登山公司提供

機器學習(一)簡介機器學習

一.寫在前面   本系列中的內容來自對李巨集毅老師的機器學習教程的理解和一些個人理解的筆記,主要用於之後方便檢視複習。李巨集毅老師的機器學習教程地址:https://www.bilibili.com/video/av35932863?from=search&seid=3902369523652897

未忘初心,未得始終——兩餘載

每份工作都有正負兩面,選擇它是因為被正面矇蔽了雙眼,離開是因為戴上了眼鏡。 —尼古拉斯·樹人·周 其實沒有預想會這麼早離開搜狗,但跟預期的時間也沒差多少。17年初加入搜狗的計劃是三年,目標是把webgl地圖引擎完成上線。截止到今年5月份,進度雖然略遲於預期但還好沒有到達deadline,穩步推進的話會

機器學習崗位面試總結:簡歷應該關注的5個重點

機器學習簡歷的一些小技巧 如今的公司很難找到優秀的機器學習人才。當然,任何特定技能的要求都取決於機器學習專案的用途和要求,但是您的機器學習履歷中必須具備的某些技能在各種專案要求中是一致的。 通常,公司希望面試者具備豐富的機器學習技能,理論和編碼能力,以便在需要時能夠跨部門參與機器學習專案。該領域的專家不僅

機器學習&數據挖掘筆記_16(常見面試機器學習算法思想簡單梳理)

回歸 utl lsa 多維 包含 的人 相互 oss 一個用戶 【轉】   前言:   找工作時(IT行業),除了常見的軟件開發以外,機器學習崗位也可以當作是一個選擇,不少計算機方向的研究生都會接觸這個,如果你的研究方向是機器學習/數據挖掘之類,且又對其非常感興趣的話

常見面試機器學習算法思想簡單梳理

聚類 優化方法 man 教程 貝葉斯理論 實現 數學之美 c函數 交叉驗證 前言:   找工作時(IT行業),除了常見的軟件開發以外,機器學習崗位也可以當作是一個選擇,不少計算機方向的研究生都會接觸這個,如果你的研究方向是機器學習/數據挖掘之類,且又對其非常感興趣的話,可以

索系統10:機器學習算法淺析

eric 功能 ood 簡單的 ons 線性回歸 不知道 效果 大堆 很多網站都有猜你喜歡,我對淘寶的推薦還是比較滿意的。很多算法都可以實現推薦功能,下面來看一看機器學習的算法: 1.回歸算法。 回歸的意思大概是,估計這堆數據這個規律,然後找出這個規律,這個過程就是回歸。s