1. 程式人生 > >百度2015年資料探勘面試題

百度2015年資料探勘面試題

面試的部門的深圳的資料探勘部門旗下的推薦與個性化團隊,電話面試了整整一個半小時,現在整理一下題目:


1、先問了下做過什麼專案

2、程式設計題兩道:

1)從N行的文字內隨機抽取M行,保證每次抽取的行都不一樣。

2)有一個int陣列,找出陣列中所有的a[i],滿足其左邊的值都比它小,右邊的值都比它大。

3、問曾經用過什麼機器學習演算法。K-means怎麼實現,線性模型抽象模型高斯聚集模型等等等。。。

4、螺母和螺栓。有N個螺母和N個螺栓,每個螺母的大小都不同,每個螺栓的大小也都不同,對每個螺母有且僅有一個螺栓與它對應。每次你可以拿起一個螺母和一個螺栓比較,看看是否匹配,如果不匹配,顯然你可以知道哪個大哪個小。但是不允許直接比較兩個螺母或兩個螺栓。現要求用最少的比較次數找出對應關係。


說說大概的解題思路:

2.1)用隨機數(n-i) (i為下標)去判斷是否小於當前m。

for (my $i = 0; $i < $all_num; $i++) {

    if (rand($all_num-$i) < $m ) {

         $labels{$i} = 1;

         $m--;

    }

}

2)http://blog.csdn.net/imzoer/article/details/8076052

4、用遞迴!


面完感覺好多都答得不好,就當做是炮灰吧。感覺百度很注重演算法和程式設計功底,我還是趕緊回去啃書吧。