Keras 處理不平衡的資料的分類問題 imbalance data 或者 highly skewed data

阿新 • • 發佈：2018-11-04

處理不平衡的資料集的時候，可以使用對資料加權來提高數量較小類的被選中的概率，具體方式如下

fit(self, x, y, batch_size=32, nb_epoch=10, verbose=1, callbacks=[], validation_split=0.0, validation_data=None, shuffle=True, class_weight=None, sample_weight=None)

class_weight：字典，將不同的類別對映為不同的權值，該引數用來在訓練過程中調整損失函式（只能用於訓練）

sample_weight：權值的numpy array

，用於在訓練時調整損失函式（僅用於訓練）。可以傳遞一個1D的與樣本等長的向量用於對樣本進行1對1的加權，或者在面對時序資料時，傳遞一個的形式為（samples，sequence_length）的矩陣來為每個時間步上的樣本賦不同的權。這種情況下請確定在編譯模型時添加了sample_weight_mode=’temporal’。

具體使用可以如下：

設定不同累的權值，如下：類0，權值1；類1，權值50

cw = {0: 1, 1: 50}

訓練模型

model.fit(x_train, y_train,batch_size=batch_size,epochs=epochs,verbose=1,callbacks=cbks,validation_data=(x_test, y_test), shuffle=True,class_weight=cw)

如果僅僅是類不平衡，則使用class_weight，sample_weights則是類內樣本之間還不平衡的時候使用。

class_weight affects the relative weight of each class in the calculation of the objective function.

sample_weights, as the name suggests, allows further control of the relative weight of samples that belong to the same class

Class weights are useful when training on highly skewed data sets; for example, a classifier to detect fraudulent transactions.

Sample weights are useful when you don't have equal confidence in the samples in your batch. A common example is performing regression on measurements with variable uncertainty.

Keras 處理不平衡的資料的分類問題 imbalance data 或者 highly skewed data

Keras 處理不平衡的資料的分類問題 imbalance data 或者 highly skewed data

不平衡資料分類演算法介紹與比較

處理不平衡資料的技巧總結！

處理不平衡資料

CNN筆記(7)---不平衡資料的處理(imbalance)

不平衡資料集的處理

機器學習中不平衡資料的處理方式

用R語言實現對不平衡資料的四種處理方法

不平衡資料集處理方法

資料不平衡時分類器效能評價（ROC曲線）

Imblearn package study（不平衡資料處理之過取樣、下采樣、綜合取樣）

機器學習svm--正確率和召回率以及基於不平衡資料的分類調參

用R處理不平衡的數據

處理非平衡資料集——SMOTE演算法

Keras 使用自己的資料分類，並使用tensorboard記錄的簡單例項

處理不均衡資料

處理不平衡類別的loss

在深度學習中處理不均衡資料集

類間樣本數量不平衡對分類模型效能的影響問題

16如何處理不均衡資料

Keras 處理 不平衡的資料的分類問題 imbalance data 或者 highly skewed data

相關推薦

Keras 處理不平衡的資料的分類問題 imbalance data 或者 highly skewed data