高斯分佈補充知識
阿新 • • 發佈:2019-01-31
PRML第二章啃到高斯分佈的時候就開始不知所云了,看了這篇BlogPRML Chapter 2.3 The Gaussian Distribution之後,覺得講的很清晰,可惜作者沒有寫完,於是轉過去看了“Methods of Multivariate Analysis ”的第三章。這裡是對這些基礎知識點的一個記錄,用來日後複習。
單變數和雙變數
單變數的均值和方差
變數y的n個觀察量
樣本均值
樣本方差:
同理
雙變數的協方差和相關性
協方差
協方差表示兩個變數之間的關係,下圖中是一些身高和體重的樣本資料
如果把樣本用下邊的圖表示出來,可以發現當身高高於平均值的時候往往體重也會高於平均值,這兩者之間可能存在一些相關
兩個隨機變數x和y之間的關係:
如果變數x和y的聯合概率密度可以表示為
如果x和y相互獨立,那麼二者的協方差
樣本協方差:
樣本協方差矩陣只衡量二者之間的線性關係
兩組樣本的樣本協方差為0表示這兩組樣本正交
相關性
從上邊可以看出,如果把變數x和y的樣本同時乘以一個係數,那麼二者的協方差也會發生變化,由此可以看出協方差與尺度相關,於是引入總體相關性: