1. 程式人生 > >專案 0: 預測泰坦尼克號乘客生還率

專案 0: 預測泰坦尼克號乘客生還率

結論

經過了數次對資料的探索和分類,你建立了一個預測泰坦尼克號乘客存活率的有用的演算法。在這個專案中你手動地實現了一個簡單的機器學習模型——決策樹(decision tree)。決策樹每次按照一個特徵把資料分割成越來越小的群組(被稱為 nodes)。每次資料的一個子集被分出來,如果分割結果的子集中的資料比之前更同質(包含近似的標籤),我們的預測也就更加準確。電腦來幫助我們做這件事會比手動做更徹底,更精確。這個連結提供了另一個使用決策樹做機器學習入門的例子。

決策樹是許多監督學習演算法中的一種。在監督學習中,我們關心的是使用資料的特徵並根據資料的結果標籤進行預測或建模。也就是說,每一組資料都有一個真正的結果值,不論是像泰坦尼克號生存資料集一樣的標籤,或者是連續的房價預測。

問題5

想象一個真實世界中應用監督學習的場景,你期望預測的結果是什麼?舉出兩個在這個場景中能夠幫助你進行預測的資料集中的特徵。