機器學習演算法與程式設計--鄭捷 C45D演算法 python3實現修改部分

阿新 • • 發佈：2019-02-11

此演算法需要更改的地方出除了上篇寫到的loadDataSet函式，在課本中getBestFeat（）函式中資訊增益計算公式處給出的矩陣相除在py3無法執行需要改為dot（A,B.T）形式

具體程式碼

def getBestFeat(self,dataSet):
        Num_Feats=len(dataSet[0][:-1])
        totality=len(dataSet)
        BaseEntropy=self.computeEntropy(dataSet)
        ConditionEntropy=[]
        splitInfo=[]
        allFeatVList=[]
        for f in range(Num_Feats):
            featList=[example[f] for example in dataSet]
            [splitI,featureValueList]=self.computeSplitInfo(featList)
            allFeatVList.append(featureValueList)
            splitInfo.append(splitI)
            resultGain=0.0
            for value in featureValueList:
                subSet=self.splitDataSet(dataSet,f,value)
                appearNum=float(len(subSet))
                subEntropy=self.computeEntropy(subSet)
                resultGain+=(appearNum/totality)*subEntropy
            ConditionEntropy.append(resultGain)
        infoGainArray=BaseEntropy*ones(Num_Feats)-array(ConditionEntropy)
       # infoGainRatio=infoGainArray/array(splitInfo)#py2可以這樣做但是py3不行
        infoGainRatio=dot(infoGainArray,array(splitInfo).T)#py3這種用法更貼近線性代數中矩陣除法形式
        bestFeatureIndex=argsort(-infoGainRatio)[0]
        return bestFeatureIndex,allFeatVList[bestFeatureIndex]

機器學習演算法與程式設計--鄭捷 C45D演算法 python3實現修改部分

機器學習演算法與程式設計--鄭捷 C45D演算法 python3實現修改部分

一份非常全面的機器學習分類與迴歸演算法的評估指標彙總

機器學習——Bagging與隨機森林演算法及其變種

機器學習研究與開發平臺的選擇

Hulu機器學習問題與解答系列 | 十四：如何對高斯分布進行采樣

Hulu機器學習問題與解答系列 | 十五：多層感知機與布爾函數

Hulu機器學習問題與解答系列 | 第九彈：循環神經網絡

Hulu機器學習問題與解答系列 | 第六彈：PCA算法

Hulu機器學習問題與解答系列 | 十九：主題模型

Hulu機器學習問題與解答系列 | 二十二：特征工程—結構化數據

Hulu機器學習問題與解答系列 | 二十三：神經網絡訓練中的批量歸一化

Hulu機器學習問題與解答系列 | 二十四：隨機梯度下降法

郭律: 論機器學習平臺與人工智能的關系

《機器學習實戰》第二章——k-近鄰演算法——筆記

機器學習-積累與發現

機器學習實戰（六）AdaBoost元演算法

機器學習實戰讀書筆記(1)--k鄰近演算法

Bobo老師機器學習筆記第五課-線性迴歸演算法的評估指標

bobo老師機器學習筆記-第四課：KNN演算法

python關聯分析 __機器學習之FP-growth頻繁項集演算法

機器學習演算法與程式設計--鄭捷 C45D演算法 python3實現 修改部分

相關推薦

機器學習演算法與程式設計--鄭捷 C45D演算法 python3實現修改部分