1. 程式人生 > >Box-Cox變換

Box-Cox變換

因變量 ecc 綜合 bce 對數 tin bsp 分享圖片 關系

簡介

編輯 Box-Cox變換的一般形式為: 技術分享圖片 式中 技術分享圖片 為經Box-Cox變換後得到的新變量, 技術分享圖片 為原始連續因變量, 技術分享圖片 為變換參數。以上變換要求原始變量 技術分享圖片 取值為正,若取值為負時,可先對所有原始數據同加一個常數 技術分享圖片 使其 技術分享圖片 為正值,然後再進行以上的變換。對不同的 技術分享圖片 所作的變換不同。在 技術分享圖片 時該變換為對數變換, 技術分享圖片 時為倒數變換,而在 技術分享圖片 時為平方根變換。Box-Cox變換中參數 技術分享圖片 的估計有兩種方法:(1)最大似然估計;(2)Bayes方法。通過求解 技術分享圖片 值,就可以確定具體采用哪種變換形式。

變換過程

編輯 Box-Cox變換是對回歸因變量Y的如下變換: 技術分享圖片
在這裏 技術分享圖片 是一個待定變換參數。對於不同的 技術分享圖片 ,所作的變換也不相同,所以Box-Cox變換是一族變換,它包括了平方根變換( 技術分享圖片 ),對數變換( 技術分享圖片 )和倒數變換( 技術分享圖片 )等常用變換,對因變量的n個觀測值 技術分享圖片 ,應用上述變換,可得變換後的向量 技術分享圖片 我們要確定變換參數 技術分享圖片 ,使得 技術分享圖片 滿足 技術分享圖片 即要求通過因變量的變換,使得變換過的向量 技術分享圖片 與回歸自變量具有線性相依關系,誤差也服從正態分布.誤差各分量是等方差且相互獨立,故Box-Cox變換是通過參數 技術分享圖片 的適當選擇。達到對原來數據的“綜合治理”,使其滿足一個正態線性回歸模型的所有假設條件。 用極大似然方法來確定 技術分享圖片 ,由於 技術分享圖片
,故對固定的 技術分享圖片技術分享圖片技術分享圖片 的似然函數為 技術分享圖片 其中, 技術分享圖片 為變換的Jacobi行列式 技術分享圖片技術分享圖片 固定時, 技術分享圖片 是不依賴於參數 技術分享圖片技術分享圖片 的常數因子, 技術分享圖片 的其余部分關於 技術分享圖片技術分享圖片 求導數,令其等於零,可求得 技術分享圖片技術分享圖片 的極大似然估計 技術分享圖片 技術分享圖片 殘差平方和為 技術分享圖片 對應的似然最大值為 技術分享圖片 該式為 技術分享圖片 的一元函數,通過求它的最大值來確定 技術分享圖片 ,因為 技術分享圖片 是x的單調函數,問題可轉化為求 技術分享圖片 的最大值,對式(3)求對數,略去與 技術分享圖片 無關的常數項,得 技術分享圖片 技術分享圖片 其中, 技術分享圖片 技術分享圖片 技術分享圖片 式(4)對Box-Cox變換在計算機上實現帶來很大的方便,因為我們只要求出殘差平方和 技術分享圖片
的最小值,就可以求出 技術分享圖片 的最大值,雖然很難找出使 技術分享圖片 達到最小值的 技術分享圖片 的解析表達式,但是對一系列的 技術分享圖片 給定值,通過最普通的求最小二乘估計的回歸程序,很容易計算出對應的 技術分享圖片 ,畫出 技術分享圖片 關於 技術分享圖片 的曲線,可在圖上近似地找出 技術分享圖片 達到最小值的 技術分享圖片 。 Box-Cox變換變換的具體步驟如下: (1)對給定的 技術分享圖片 值,計算 技術分享圖片 ,如果 技術分享圖片 ,用式(6)計算,否則用式(7); (2)利用式(5)計算殘差平方和 技術分享圖片 ; (3)對一系列的 技術分享圖片 值,重復上述步驟,得到相應的殘差平方和 技術分享圖片 的一串值,以 技術分享圖片 為橫軸,作出相應的曲線,用直觀的方法,找出使 技術分享圖片 達到最小值的點 技術分享圖片 。 (4)利用式(2),求出 技術分享圖片

意義

編輯 Box-Cox變換的一個顯著優點是通過求變換參數 技術分享圖片 來確定變換形式,而這個過程完全基於數據本身而無須任何先驗信息,這無疑比憑經驗或通過嘗試而選用對數、平方根等變換方式要客觀和精確。 Box-Cox變換的目的是為了讓數據滿足線性模型的基本假定,即線性、正態性及方差齊性,然而經Box-Cox變換後數據是否同時滿足了以上假定,仍需要考察驗證 [2] 。

Box-Cox變換