1. 程式人生 > 實用技巧 >熵權法、極差法標準化簡介與實戰

熵權法、極差法標準化簡介與實戰

熵權法有啥用?

可利用資訊熵這個工具,計算出各個指標的權重,為多指標綜合評價提供依據。
下面的實戰中,最終計算的熵權結果為,C語言課程成績權重佔0.99,剩下的兩門課成績權重幾乎為0,很好理解,因為體育和資料庫大家的分都普遍偏高,體現不出來設麼東西。

什麼是熵

在這裡插入圖片描述

熵權如何計算

在這裡插入圖片描述

實戰示例

在這裡插入圖片描述

一、計算每一列的總和

在這裡插入圖片描述

二、每一個數據更新為除以總和後的值,即Pij

在這裡插入圖片描述

三、計算ln(Pij)

在這裡插入圖片描述

四、得到熵值Hi

在這裡插入圖片描述

使用公式計算熵值Hi,其中n表示一共幾個學生
在這裡插入圖片描述

五、得到熵權Wi

在這裡插入圖片描述

在這裡插入圖片描述

總結與反思

經過這個例項,我們可以發現,當一組資料波動比較大時,它的權重是很大的,但我們不禁反思熵權法存在的問題,難道資料庫原理就沒有參考價值?

我們最後得到的Wi是客觀值,但是我們可以認為主觀的進行調整,主觀客觀相結合也是很棒的哦!

優點

  • 能深刻反映出指標的區分能力,進而確定權重
  • 是一種客觀賦權法,相對主管賦權具有較高的可信度和精確度
  • 演算法簡單

缺點

  • 不夠智慧,沒有考慮指標與指標之間的影響,如:相關性、層級關係等
  • 若無業務經驗指導,權重可能失真
  • 對樣本的依賴性較大,隨著建模樣本不斷變化,權重會發生一定波動

注意的地方

當一個表的幾組資料單位不同時,我們應該對資料進行極差標準化,用標準化後的資料來進行熵權法分析,如圖,這個表最下面的p開始,這一部分就是在計算p哦,就是咱們上面的第二步
在這裡插入圖片描述

極差法標準化公式:
在這裡插入圖片描述

通過極差法標準化,我們就可以把原來的資料標準化到0-1之間內了,哈哈哈爽哦!