1. 程式人生 > >資料統計分析的歸一化問題

資料統計分析的歸一化問題

為什麼需要歸一化?

答:

1、我認為歸一化的表述並不太準確,按統計的一般說法,叫標準化。資料的標準化過程是減去均值併除以標準差。而歸一化僅包含除以標準差的意思或者類似做法。
2、做標準化的原因是:減去均值等同於座標的移動,把原始資料點的重心移到和原點重合,這樣利於很多表達,比如資料的協方差矩陣可以寫成XX',若沒有減去均值,則XX‘後面還要減去一些東西(還不明白可以參考多元統計分析的書)。除以標準差是為了統一併消除量綱。一個矩陣中有多個向量,有些可能表示了長度,有些表示了重量,除以標準差,才能讓它們僅以“數”的概念一起比較運算。
3、標準化的做法。舉例,若你的矩陣A是5行3列,第一列表示長度,第二列表示時間,第三列表示質量,那麼矩陣A等同於對這個三個量進行了5次測量,所以5*3.這樣3個分量有各自的均值和標準差,對這個矩陣中15個元素均做標準化只要減去長度、時間、質量各自的均值併除以標準差即可。

影象不需要除以標準差,因為他們都是畫素值,同量綱同尺度。只減均值就行。