用DecisionTree決策樹來求取分類閾值
阿新 • • 發佈:2019-01-28
在二分類任務中,我們經常需要根據概率值來確定類別。通常的方法是設定0.5的中間閾值,但是在一些不平衡的任務中,我們並不知道閾值應該設定為多少,這時可以簡單的利用決策樹的方法,視覺化的來求得最優閾值。當然你也可以用一個簡單的神經網路來擬合這個閾值。
下面就是python呼叫sklearn庫來實現的閾值求解程式碼:
from sklearn import tree
X = []
Y = []
for line in f_lines:
x = [line.strip()]
X.append(x)
for line in f1_lines:
Y.append(line.strip ())
print(len(X))
print(len(Y))
clf = tree.DecisionTreeClassifier()
clf = clf.fit(X, Y)
print(clf.get_params())
import graphviz
dot_data = tree.export_graphviz(clf,out_file=None)
graph = graphviz.Source(dot_data)
graph.render("iris")
graph