1. 程式人生 > >python sklearn預處理方法

python sklearn預處理方法

1. 標準化(scale)

標準化目的是去均值。變換後各維特徵有0均值,單位方差。也叫z-score規範化(零均值規範化)。計算方式是將特徵值減去均值,除以標準差。

import numpy as np
from sklearn import preprocessing

in_data = np.array([[5.1, -2.9, 3.3],[-1.2, 7.8, -6.1]])

data_scale = preprocessing.scale(in_data)

2.最小-最大規範化(Min_Max_Scaler)

最小-最大規範化對原始資料進行線性變換,變換到[0,1]區間

3.規範化(Normalization)

規範化是將不同變化範圍的值對映到相同的固定範圍,常見的是[0,1],此時也稱為歸一化。

將每個樣本變換成unit norm。常見的L1 norm和L2 norm

L2 norm變換後每個樣本的各維特徵的平方和為1

L1 norm變換後每個樣本的各維特徵的絕對值和為1

preprocessing.normalize(in_data, norm='l2')
preprocessing.normalize(in_data, norm='l1')

參考:

sklearn中常用資料預處理方法

人工智慧:python程式碼實現