1. 程式人生 > >對泰坦尼克號案例進行資料探勘

對泰坦尼克號案例進行資料探勘

1.基本概念

對歷史資料的計算,對未來還沒有發生的事情做預測。

訓練集:訓練模型

測試集:測試模型好壞

驗證集:選擇引數(如何通過驗證集來選擇引數?)

將歷史資料劃分為以上三個部分。

建立模型時如何知道模型的好壞:評估標準

評估標準:優化代價函式J(theta)誤差平方和,目標就是優化代價函式,使之達到最小。