1. 程式人生 > >什麼是資料分析/資料科學?

什麼是資料分析/資料科學?

因果關係一定比相關關係好嗎?不一定,要看問題的關注點。當我們關注“可能是什麼”,我們需要做更多預測,這個時候我們應該關注相關關係;當我們關注“為什麼是這樣”,我們需要做更多解釋,這個時候我們應該關注因果關係。比如說我的畢業論文研究電商平臺的搜尋演算法如何影響消費者和生產者決策,我建立了基於consideration set approach的(動態)結構模型,把消費者的選擇分為兩步:第一步,平臺推薦演算法推薦商品給消費者,比如第一頁的商品通常更容易被看到;第二步,消費者從看到的商品裡面做購買選擇。第二步的模型是一個基於random utility framework的離散選擇模型,是一個標準的用來解釋因果關係的結構模型;第一步我嘗試了將近一年,用參考文獻裡面用的可以解釋機理的概率模型,已經徹底宣告失敗,這裡我關心的是演算法最可能推薦什麼,而不需要非常清楚地推薦的過程(因為演算法本身極其複雜,簡單的模型不可能準確解釋機理,概率模型有利於人理解機理;文章關注的也不是演算法的機理,而是演算法的影響),更好的辦法是通過訓練資料找出最好的預測模型。