1. 程式人生 > >實戰03 分門別類 非此即彼——決策樹

實戰03 分門別類 非此即彼——決策樹

適用型別:數值型和標稱型。
優點:對中間值的缺失不敏感。

尋找劃分資料集的最好特徵——資訊增益
劃分資料集——最大資訊增益

array型別不具有append()方法,需要強轉為list型別。

#使用pickle模組儲存決策樹
def storeTree(inputTree, filename):
import pickle
fw = open(filename, ‘wb’, 0)#wb的寫入方式才行
pickle.dump(inputTree, fw)#序列化物件,儲存到fw檔案中
fw.close()

def grabTree(filename):
import pickle
fr = open(filename,‘rb

’)#rb的讀取方式才行
return pickle.load(fr)#反序列化物件,將檔案中的資料解析為一個python物件。