阿里資料分析師實習生筆試題2014年3月29日
時間為90分鐘
題型:10道選擇,3道簡答,2道分析題
回憶版
選擇題:
1)若 r=0,則兩者的關係:
我選擇的是 沒有線性關係
2)以下兩種行為分別對應哪種分類演算法的評價標準:
行為1:警察如何判別某人是小偷
行為2:小偷是如何被識別出來(+_+行為記不清楚,請記得的童鞋補上)
選項是Recall Precision ROC的組合,這題不會
3)以下哪項對Hadoop的描述是不正確的
4)HIVE的描述
5)公司員工的平均工資是3000,中位數是2500,眾數是2000,則下面哪個說法不正確:
我選擇的是 大部分員工的工資都在2000
6)有個小松鼠從離家100米的地方搬松子回家,共有1000顆(?),小松鼠每次最多能搬50顆,小松鼠很饞,每走兩米就要吃掉一顆,問小松鼠最後能搬多少顆松子回家?
A 0 B 5 C 10 D 25 嗚嗚~記不太清,我選了0
7)正態分佈的區間估計,若其他條件不變,置信水平L越小,則置信上限和置信下限的差
A 越大 B 越小 C 不變 D 不確定
簡答:
1)世界上每十萬人中有一個患有艾滋病,如果某人患有艾滋病,則一定會被檢查出來,如果某人沒有患艾滋病,被錯誤診斷的概率為1%,假設有一個人被診斷出是陽性,那麼他患艾滋病的概率多大?
2)按要求寫出SQL語句
a)表t1,欄位有user_id(字元型),city(城市,字元型),age(年齡,數值型)
b)表t2,欄位有user_id(字元型),yyyymmdd(數值型,日期),age(年齡,數值型),city,GMV_1314(銷量,數值型)
其中表t2中的user_id都能在t1中user_id找到
建立一個表t3,使其中包含t1中所有user_id,年齡大於或者等於16,城市是廣州或者深圳,表t2中12月銷量彙總
3)什麼是層次分析法?使用的一般過程?舉個使用的場景或者例子
分析:
1)淘寶是萬能的,怎挑出小眾且有品位的店鋪,給出方案
2)雙11做促銷活動,商家發放促銷券,請從平臺和商家角度完成以下分析:
a)給出評估指標
b)根據給出的資料,為商家和平臺推動計劃給出建議
其中,優惠券是商家自動發放的,有兩種,一種是滿200減50,一種是滿300減100;優惠券發放日期為10月15到11月10,使用時間為11月11日