資料探勘前景及工作方向選擇
也可以參考如《資料探勘:實用機器學習技術及Java實現》
推薦系統, 垃圾郵件過濾,文字挖掘,情感分析,廣告點選率預測
A sponsored advertisement:
百度
淘寶
以及各家搜尋公司
B behavior based advertisement:
騰訊
C 站內商品推薦:
淘寶
噹噹
C 興趣推薦:
豆瓣
優酷
D 關係挖掘
人人
騰訊
商品推薦的話:亞馬遜吧。你查查就知道它的系統有多牛了。引用浪潮之顛作者吳軍的話:語音識別在過去的15年,錯誤率下降了一半,其中70%的功勞來自於資料量的增加,30%是方法的改進。 雖然不完全類似,但還是可以推出,去有資料的地方,才是研究資料探勘的沃土。大型的網際網路企業的相對線下的調查公司,資料採集的成本要低很多
用排除法
1、公司大環境不好的不去,面對一大堆資料和演算法都夠頭痛了,沒空搭理那些是非傾軋
2、首先資料量稀疏,使用者量級小的專案不去,因為基礎資料直接決定了CTR轉化率
3、沒將個性化推薦提至戰略級別的公司不去,不受重視的專案永遠都存在資源匱乏的問題,巧婦難為無米之炊
4、資料探勘、推薦引擎優化無法直接帶來商業收入或流量轉化的不去,不然會導致你長期沒有存在
機器學習和資料探勘目前在國內應用程度都比較淺,先行者也沒有走遠。如果自己定位於修煉者,應該選擇一個好的環境,首先是公司的認識到位,然後是團隊能夠開放,這方面阿里系做得不錯。如果自己定位在成名立腕,需要考慮平臺能夠支撐用資料進行產品創新,這方面百度和騰訊更有機會。其他公司的資料非海量,而且發展前景有限。