1. 程式人生 > >kaggle之路(1)

kaggle之路(1)

使用kaggle資料需要先註冊賬號。註冊成功後可以下載資料,提交結果,可fork他人的notebook和kernel,並在線執行。若要自己create notebook或kernel,需要根據提示完善資料,並upvote(給他人的notebook點個贊)。完善資料中的add location和bio需要注意。add location大概是由於連結到的location資料庫在境外被牆,必須爬過高牆後才能填寫,不會fq的推薦用green vpn,真正免費一鍵vpn。bio填寫在電腦網頁上沒找到,後用手機上瀏覽器開啟手機版網頁才找到。

1. 學習使用kaggle-->kernel/notebook,線上執行,提交資料。fork 《TatanicLearningQI》,得分排名27%,此kernel的特點是特徵處理的很細緻,用隨機森林方法既能得到好結果。

2. 安裝XGboost,並在titanic上測試,參照


<Installing XGBoost For Anaconda on Windows>

悲劇,MinGW線上安裝失敗,下載無響應


3. 

練習IMBD預測專案《Bag of Words Meets Bags of Popcorn》,對自然語言處理方法和工具不熟,只是跑了下書上的程式碼,其中NLTK中的stopwords可能是沒有下載的原因,總是報錯,遮蔽了stopwords過濾就好了。