熵權法、極差法標準化簡介與實戰
阿新 • • 發佈:2020-10-22
熵權法有啥用?
可利用資訊熵這個工具,計算出各個指標的權重,為多指標綜合評價提供依據。
下面的實戰中,最終計算的熵權結果為,C語言課程成績權重佔0.99,剩下的兩門課成績權重幾乎為0,很好理解,因為體育和資料庫大家的分都普遍偏高,體現不出來設麼東西。
什麼是熵
熵權如何計算
實戰示例
一、計算每一列的總和
二、每一個數據更新為除以總和後的值,即Pij
三、計算ln(Pij)
四、得到熵值Hi
使用公式計算熵值Hi,其中n表示一共幾個學生
五、得到熵權Wi
總結與反思
經過這個例項,我們可以發現,當一組資料波動比較大時,它的權重是很大的,但我們不禁反思熵權法存在的問題,難道資料庫原理就沒有參考價值?
優點
- 能深刻反映出指標的區分能力,進而確定權重
- 是一種客觀賦權法,相對主管賦權具有較高的可信度和精確度
- 演算法簡單
缺點
- 不夠智慧,沒有考慮指標與指標之間的影響,如:相關性、層級關係等
- 若無業務經驗指導,權重可能失真
- 對樣本的依賴性較大,隨著建模樣本不斷變化,權重會發生一定波動
注意的地方
當一個表的幾組資料單位不同時,我們應該對資料進行極差標準化,用標準化後的資料來進行熵權法分析,如圖,這個表最下面的p開始,這一部分就是在計算p哦,就是咱們上面的第二步
極差法標準化公式:
通過極差法標準化,我們就可以把原來的資料標準化到0-1之間內了,哈哈哈爽哦!