1. 程式人生 > >機器學習--特徵工程1

機器學習--特徵工程1

之前面試遇到過好幾次特徵工程的理解,學習一下特徵工程系列知識

參考地址:

1.特徵工程定義

資料和特徵決定了機器學習的上限,而模型和演算法只是逼近這個上限而已。最大限度地從原始資料中提取特徵以供演算法和模型使用

特徵工程主要知識點如下所示:

2.sklearn.preprocessing

結合sklearn來學習一下資料的預處理過程:

安裝  pip install -U scikit-learn

資料的標準化處理:大多數scikit庫都需要將資料進行標準化處理:

Gaussian with zero mean and unit variance  均值為0 單位方差的高斯分佈資料