1. 程式人生 > >離群點檢測(Novelty Detection, Outlier Detenction)

離群點檢測(Novelty Detection, Outlier Detenction)

適合問題: 對於無標籤的資料, 又想找出壞使用者,完成業務目標。

參考: https://scikit-learn.org/stable/modules/outlier_detection.html

演算法:

  1. one class SVM, 原理: 特徵空間中, 分割平面離原點的距離大
  2. IsolationForest , 原理: 異常點在隨機分割的森林中,點到根的平均路徑要比正常點小很多。
  3. 其他方差,PCA等。
  4. Local Outlier Factor, 適合給定資料集, 不能做預測。
  5. 複雜演算法, https://arxiv.org/pdf/1803.01798.pdf

應用:

  1. https://gallery.azure.ai/Experiment/1219e87f8fb84e88a2e1b54256808bb3
  2. https://www.kaggle.com/dloden/credit-card-fraud-detection