1. 程式人生 > >2.2決策樹之資訊增益率

2.2決策樹之資訊增益率

資訊增益率

資訊增益率計算公式:Gain-ratio=GainA/I

GA)即Gain(SA)=E(S)–E(SA)

如下圖所示:屬性A有五個取值,每個取值對應一個例項,則I1,1,1,1,1=-1/5*log(1,5)*5

即:資訊增益率的計算在掌握了資訊增益的計算的基礎上,需要知道分母怎麼算,分母的演算法與E(S,A)的演算法不同,再舉一個例子:

outlook的資訊增益率的計算:

GS,A=ES-ESA

Gain-ratioA=GSA/I

I5,4,5=-5/14log(5,14)-4/14log(4,14)-5/14(5,14)

其中,log5,14)即為log2(5/14).