1. 程式人生 > >傅立葉變換的原理、意義以及如何用Matlab實現快速傅立葉變換

傅立葉變換的原理、意義以及如何用Matlab實現快速傅立葉變換

本帖最後由 xiaoliu 於 2011-7-28 21:00 編輯

一、傅立葉變換的由來

關於傅立葉變換,無論是書本還是在網上可以很容易找到關於傅立葉變換的描述,但是大都是些故弄玄虛的文章,太過抽象,盡是一些讓人看了就望而生畏的公式的羅列,讓人很難能夠從感性上得到理解,最近,我偶爾從網上看到一個關於數字訊號處理的電子書籍,是一個叫Steven W. Smith, Ph.D.外國人寫的,寫得非常淺顯,裡面有七章由淺入深地專門講述關於離散訊號的傅立葉變換,雖然是英文文件,我還是硬著頭皮看完了有關傅立葉變換的有關內容,看了有茅塞頓開的感覺,在此把我從中得到的理解拿出來跟大家分享,希望很多被傅立葉變換迷惑的朋友能夠得到一點啟發,這電子書籍是免費的,有興趣的朋友也可以從網上下載下來看一下,URL地址是:


http://www.dspguide.com/pdfbook.htm

要理解傅立葉變換,確實需要一定的耐心,別一下子想著傅立葉變換是怎麼變換的,當然,也需要一定的高等數學基礎,最基本的是級數變換,其中傅立葉級數變換是傅立葉變換的基礎公式。

二、傅立葉變換的提出

讓我們先看看為什麼會有傅立葉變換?傅立葉是一位法國數學家和物理學家的名字,英語原名是Jean Baptiste Joseph Fourier(1768-1830), Fourier對熱傳遞很感興趣,於1807年在法國科學學會上發表了一篇論文,運用正弦曲線來描述溫度分佈,論文裡有個在當時具有爭議性的決斷:任何連續週期訊號可以由一組適當的正弦曲線組合而成。當時審查這個論文的人,其中有兩位是歷史上著名的數學家拉格朗日(Joseph Louis Lagrange, 1736-1813)和拉普拉斯(Pierre Simon de Laplace, 1749-1827),當拉普拉斯和其它審查者投票通過並要發表這個論文時,拉格朗日堅決反對,在近50年的時間裡,拉格朗日堅持認為傅立葉的方法無法表示帶有稜角的訊號,如在方波中出現非連續變化斜率。法國科學學會屈服於拉格朗日的威望,拒絕了傅立葉的工作,幸運的是,傅立葉還有其它事情可忙,他參加了政治運動,隨拿破崙遠征埃及,法國大革命後因會被推上斷頭臺而一直在逃避。直到拉格朗日死後15年這個論文才被髮表出來。


誰是對的呢?拉格朗日是對的:正弦曲線無法組合成一個帶有稜角的訊號。但是,我們可以用正弦曲線來非常逼近地表示它,逼近到兩種表示方法不存在能量差別,基於此,傅立葉是對的。

為什麼我們要用正弦曲線來代替原來的曲線呢?如我們也還可以用方波或三角波來代替呀,分解訊號的方法是無窮的,但分解訊號的目的是為了更加簡單地處理原來的訊號。用正餘弦來表示原訊號會更加簡單,因為正餘弦擁有原訊號所不具有的性質:正弦曲線保真度。一個正弦曲線訊號輸入後,輸出的仍是正弦曲線,只有幅度和相位可能發生變化,但是頻率和波的形狀仍是一樣的。且只有正弦曲線才擁有這樣的性質,正因如此我們才不用方波或三角波來表示。

三、傅立葉變換分類

根據原訊號的不同型別,我們可以把傅立葉變換分為四種類別:


1

非週期性連續訊號

傅立葉變換(Fourier Transform)

2

週期性連續訊號

傅立葉級數(Fourier Series)

3

非週期性離散訊號

離散時域傅立葉變換(Discrete Time Fourier Transform)

4

週期性離散訊號

離散傅立葉變換(Discrete Fourier Transform)

下圖是四種原訊號圖例:





這四種傅立葉變換都是針對正無窮大和負無窮大的訊號,即訊號的的長度是無窮大的,我們知道這對於計算機處理來說是不可能的,那麼有沒有針對長度有限的傅立葉變換呢?沒有。因為正餘弦波被定義成從負無窮小到正無窮大,我們無法把一個長度無限的訊號組合成長度有限的訊號。面對這種困難,方法是把長度有限的訊號表示成長度無限的訊號,可以把訊號無限地從左右進行延伸,延伸的部分用零來表示,這樣,這個訊號就可以被看成是非週期性離解訊號,我們就可以用到離散時域傅立葉變換的方法。還有,也可以把訊號用複製的方法進行延伸,這樣訊號就變成了週期性離解訊號,這時我們就可以用離散傅立葉變換方法進行變換。這裡我們要學的是離散訊號,對於連續訊號我們不作討論,因為計算機只能處理離散的數值訊號,我們的最終目的是運用計算機來處理訊號的。

但是對於非週期性的訊號,我們需要用無窮多不同頻率的正弦曲線來表示,這對於計算機來說是不可能實現的。所以對於離散訊號的變換隻有離散傅立葉變換(DFT)才能被適用,對於計算機來說只有離散的和有限長度的資料才能被處理,對於其它的變換型別只有在數學演算中才能用到,在計算機面前我們只能用DFT方法,後面我們要理解的也正是DFT方法。這裡要理解的是我們使用週期性的訊號目的是為了能夠用數學方法來解決問題,至於考慮週期性訊號是從哪裡得到或怎樣得到是無意義的。

每種傅立葉變換都分成實數和複數兩種方法,對於實數方法是最好理解的,但是複數方法就相對複雜許多了,需要懂得有關複數的理論知識,不過,如果理解了實數離散傅立葉變換(real DFT),再去理解複數傅立葉就更容易了,所以我們先把複數的傅立葉放到一邊去,先來理解實數傅立葉變換,在後面我們會先講講關於複數的基本理論,然後在理解了實數傅立葉變換的基礎上再來理解複數傅立葉變換。

還有,這裡我們所要說的變換(transform)雖然是數學意義上的變換,但跟函式變換是不同的,函式變換是符合一一映射準則的,對於離散數字訊號處理(DSP),有許多的變換:傅立葉變換、拉普拉斯變換、Z變換、希爾伯特變換、離散餘弦變換等,這些都擴充套件了函式變換的定義,允許輸入和輸出有多種的值,簡單地說變換就是把一堆的資料變成另一堆的資料的方法。

四、傅立葉變換的物理意義

傅立葉變換是數字訊號處理領域一種很重要的演算法。要知道傅立葉變換演算法的意義,首先要了解傅立葉原理的意義。傅立葉原理表明:任何連續測量的時序或訊號,都可以表示為不同頻率的正弦波訊號的無限疊加。而根據該原理創立的傅立葉變換演算法利用直接測量到的原始訊號,以累加方式來計算該訊號中不同正弦波訊號的頻率、振幅和相位。

和傅立葉變換演算法對應的是反傅立葉變換演算法。該反變換從本質上說也是一種累加處理,這樣就可以將單獨改變的正弦波訊號轉換成一個訊號。因此,可以說,傅立葉變換將原來難以處理的時域訊號轉換成了易於分析的頻域訊號(訊號的頻譜),可以利用一些工具對這些頻域訊號進行處理、加工。最後還可以利用傅立葉反變換將這些頻域訊號轉換成時域訊號。

從現代數學的眼光來看,傅立葉變換是一種特殊的積分變換。它能將滿足一定條件的某個函式表示成正弦基函式的線性組合或者積分。在不同的研究領域,傅立葉變換具有多種不同的變體形式,如連續傅立葉變換和離散傅立葉變換。

在數學領域,儘管最初傅立葉分析是作為熱過程的解析分析的工具,但是其思想方法仍然具有典型的還原論和分析主義的特徵。"任意"的函式通過一定的分解,都能夠表示為正弦函式的線性組合的形式,而正弦函式在物理上是被充分研究而相對簡單的函式類:1. 傅立葉變換是線性運算元,若賦予適當的範數,它還是酉運算元;2. 傅立葉變換的逆變換容易求出,而且形式與正變換非常類似;3. 正弦基函式是微分運算的本徵函式,從而使得線性微分方程的求解可以轉化為常係數的代數方程的求解.線上性時不變雜的卷積運算為簡單的乘積運算,從而提供了計算卷積的一種簡單手段;4. 離散形式的傅立葉的物理系統內,頻率是個不變的性質,從而系統對於複雜激勵的響應可以通過組合其對不同頻率正弦訊號的響應來獲取;5. 著名的卷積定理指出:傅立葉變換可以化復變換可以利用數字計算機快速的算出(其演算法稱為快速傅立葉變換演算法(FFT))。

正是由於上述的良好性質,傅立葉變換在物理學、數論、組合數學、訊號處理、概率、統計、密碼學、聲學、光學等領域都有著廣泛的應用。

五、影象傅立葉變換的物理意義

影象的頻率是表徵影象中灰度變化劇烈程度的指標,是灰度在平面空間上的梯度。如:大面積的沙漠在影象中是一片灰度變化緩慢的區域,對應的頻率值很低;而對於地表屬性變換劇烈的邊緣區域在影象中是一片灰度變化劇烈的區域,對應的頻率值較高。傅立葉變換在實際中有非常明顯的物理意義,設f是一個能量有限的模擬訊號,則其傅立葉變換就表示f的譜。從純粹的數學意義上看,傅立葉變換是將一個函式轉換為一系列周期函式來處理的。從物理效果看,傅立葉變換是將影象從空間域轉換到頻率域,其逆變換是將影象從頻率域轉換到空間域。換句話說,傅立葉變換的物理意義是將影象的灰度分佈函式變換為影象的頻率分佈函式,傅立葉逆變換是將影象的頻率分佈函式變換為灰度分佈函式。

傅立葉變換以前,影象(未壓縮的點陣圖)是由對在連續空間(現實空間)上的取樣得到一系列點的集合,我們習慣用一個二維矩陣表示空間上各點,則影象可由z=f(x,y)來表示。由於空間是三維的,影象是二維的,因此空間中物體在另一個維度上的關係就由梯度來表示,這樣我們可以通過觀察影象得知物體在三維空間中的對應關係。為什麼要提梯度?因為實際上對影象進行二維傅立葉變換得到頻譜圖,就是影象梯度的分佈圖,當然頻譜圖上的各點與影象上各點並不存在一一對應的關係,即使在不移頻的情況下也是沒有。傅立葉頻譜圖上我們看到的明暗不一的亮點,實際上影象上某一點與鄰域點差異的強弱,即梯度的大小,也即該點的頻率的大小(可以這麼理解,影象中的低頻部分指低梯度的點,高頻部分相反)。一般來講,梯度大則該點的亮度強,否則該點亮度弱。這樣通過觀察傅立葉變換後的頻譜圖,也叫功率圖,我們首先就可以看出,影象的能量分佈,如果頻譜圖中暗的點數更多,那麼實際影象是比較柔和的(因為各點與鄰域差異都不大,梯度相對較小),反之,如果頻譜圖中亮的點數多,那麼實際影象一定是尖銳的,邊界分明且邊界兩邊畫素差異較大的。對頻譜移頻到原點以後,可以看出影象的頻率分佈是以原點為圓心,對稱分佈的。將頻譜移頻到圓心除了可以清晰地看出影象頻率分佈以外,還有一個好處,它可以分離出有周期性規律的干擾訊號,比如正弦干擾,一副帶有正弦干擾,移頻到原點的頻譜圖上可以看出除了中心以外還存在以某一點為中心,對稱分佈的亮點集合,這個集合就是干擾噪音產生的,這時可以很直觀的通過在該位置放置帶阻濾波器消除干擾。

另外我還想說明以下幾點: 
1、影象經過二維傅立葉變換後,其變換系數矩陣表明: 
若變換矩陣Fn原點設在中心,其狊譜能量集中分佈在變換系數短陣的中心附近(圖中陰影區)。若所用的二維傅立葉變換矩陣Fn的原點設在左上角,那麼影象訊號能量將集中在係數矩陣的四個角上。這是由二維傅立葉變換本身性質決定的。同時也表明一股影象能量集中低頻區域。 
2 、變換之後的影象在原點平移之前四角是低頻,最亮,平移之後中間部分是低頻,最亮,亮度大說明低頻的能量大(幅角比較大)。

六、一個關於實數離散傅立葉變換(Real DFT)的例子

先來看一個變換例項,一個原始訊號的長度是16,於是可以把這個訊號分解9個餘弦波和9個正弦波(一個長度為N的訊號可以分解成N/2+1個正餘弦訊號,這是為什麼呢?結合下面的18個正餘弦圖,我想從計算機處理精度上就不難理解,一個長度為N的訊號,最多隻能有N/2+1個不同頻率,再多的頻率就超過了計算機所能所處理的精度範圍),如下圖:

9個正弦訊號:



9個餘弦訊號:



把以上所有訊號相加即可得到原始訊號,至於是怎麼分別變換出9種不同頻率訊號的,我們先不急,先看看對於以上的變換結果,在程式中又是該怎麼表示的,我們可以看看下面這個示例圖:



上圖中左邊表示時域中的訊號,右邊是頻域訊號表示方法,從左向右表示正向轉換(Forward DFT),從右向左表示逆向轉換(Inverse DFT),用小寫x[]表示訊號在每個時間點上的幅度值陣列, 用大寫X[]表示每種頻率的副度值陣列, 因為有N/2+1種頻率,所以該陣列長度為N/2+1,X[]陣列又分兩種,一種是表示餘弦波的不同頻率幅度值:Re X[],另一種是表示正弦波的不同頻率幅度值:Im X[],Re是實數(Real)的意思,Im是虛數(Imagine)的意思,採用複數的表示方法把正餘弦波組合起來進行表示,但這裡我們不考慮複數的其它作用,只記住是一種組合方法而已,目的是為了便於表達(在後面我們會知道,複數形式的傅立葉變換長度是N,而不是N/2+1)。

七、用Matlab實現快速傅立葉變換

FFT是離散傅立葉變換的快速演算法,可以將一個訊號變換到頻域。有些訊號在時域上是很難看出什麼特徵的,但是如果變換到頻域之後,就很容易看出特徵了。這就是很多訊號分析採用FFT變換的原因。另外,FFT可以將一個訊號的頻譜提取出來,這在頻譜分析方面也是經常用的。 
雖然很多人都知道FFT是什麼,可以用來做什麼,怎麼去做,但是卻不知道FFT之後的結果是什意思、如何決定要使用多少點來做FFT。 
現在就根據實際經驗來說說FFT結果的具體物理意義。一個模擬訊號,經過ADC取樣之後,就變成了數字訊號。取樣定理告訴我們,取樣頻率要大於訊號頻率的兩倍,這些我就不在此囉嗦了。 
取樣得到的數字訊號,就可以做FFT變換了。N個取樣點,經過FFT之後,就可以得到N個點的FFT結果。為了方便進行FFT運算,通常N取2的整數次方。 
假設取樣頻率為Fs,訊號頻率F,取樣點數為N。那麼FFT之後結果就是一個為N點的複數。每一個點就對應著一個頻率點。這個點的模值,就是該頻率值下的幅度特性。具體跟原始訊號的幅度有什麼關係呢?假設原始訊號的峰值為A,那麼FFT的結果的每個點(除了第一個點直流分量之外)的模值就是A的N/2倍。而第一個點就是直流分量,它的模值就是直流分量的N倍。而每個點的相位呢,就是在該頻率下的訊號的相位。第一個點表示直流分量(即0Hz),而最後一個點N的再下一個點(實際上這個點是不存在的,這裡是假設的第N+1個點,也可以看做是將第一個點分做兩半分,另一半移到最後)則表示取樣頻率Fs,這中間被N-1個點平均分成N等份,每個點的頻率依次增加。例如某點n所表示的頻率為:Fn=(n-1)*Fs/N。由上面的公式可以看出,Fn所能分辨到頻率為為Fs/N,如果取樣頻率Fs為1024Hz,取樣點數為1024點,則可以分辨到1Hz。1024Hz的取樣率取樣1024點,剛好是1秒,也就是說,取樣1秒時間的訊號並做FFT,則結果可以分析到1Hz,如果取樣2秒時間的訊號並做FFT,則結果可以分析到0.5Hz。如果要提高頻率分辨力,則必須增加取樣點數,也即取樣時間。頻率解析度和取樣時間是倒數關係。 
假設FFT之後某點n用複數a+bi表示,那麼這個複數的模就是An=根號a*a+b*b,相位就是Pn=atan2(b,a)。根據以上的結果,就可以計算出n點(n≠1,且n<=N/2)對應的訊號的表示式為:An/(N/2)*cos(2*pi*Fn*t+Pn),即2*An/N*cos(2*pi*Fn*t+Pn)。對於n=1點的訊號,是直流分量,幅度即為A1/N。由於FFT結果的對稱性,通常我們只使用前半部分的結果,即小於取樣頻率一半的結果。 
下面以一個實際的訊號來做說明。假設我們有一個訊號,它含有2V的直流分量,頻率為50Hz、相位為-30度、幅度為3V的交流訊號,以及一個頻率為75Hz、相位為90度、幅度為1.5V的交流訊號。用數學表示式就是如下:S=2+3*cos(2*pi*50*t-pi*30/180)+1.5*cos(2*pi*75*t+pi*90/180)。式中cos引數為弧度,所以-30度和90度要分別換算成弧度。我們以256Hz的取樣率對這個訊號進行取樣,總共取樣256點。按照我們上面的分析,Fn=(n-1)*Fs/N,我們可以知道,每兩個點之間的間距就是1Hz,第n個點的頻率就是n-1。我們的訊號有3個頻率:0Hz、50Hz、75Hz,應該分別在第1個點、第51個點、第76個點上出現峰值,其它各點應該接近0。實際情況如何呢?我們來看看FFT的結果的模值如圖所示。



從圖中我們可以看到,在第1點、第51點、和第76點附近有比較大的值。我們分別將這三個點附近的資料拿上來細看: 
1點: 512+0i 
2點: -2.6195E-14 - 1.4162E-13i 
3點: -2.8586E-14 - 1.1898E-13i 
50點:-6.2076E-13 - 2.1713E-12i 
51點:332.55 - 192i 
52點:-1.6707E-12 - 1.5241E-12i 
75點:-2.2199E-13 -1.0076E-12i 
76點:3.4315E-12 + 192i 
77點:-3.0263E-14 +7.5609E-13i 
很明顯,1點、51點、76點的值都比較大,它附近的點值都很小,可以認為是0,即在那些頻率點上的訊號幅度為0。接著,我們來計算各點的幅度值。分別計算這三個點的模值,結果如下: 
1點: 512 
51點:384 
76點:192 
按照公式,可以計算出直流分量為:512/N=512/256=2;50Hz訊號的幅度為:384/(N/2)=384/(256/2)=3;75Hz訊號的幅度為192/(N/2)=192/(256/2)=1.5。可見,從頻譜分析出來的幅度是正確的。 
然後再來計算相位資訊。直流訊號沒有相位可言,不用管它。先計算50Hz訊號的相位,atan2(-192, 332.55)=-0.5236,結果是弧度,換算為角度就是180*(-0.5236)/pi=-30.0001。再計算75Hz訊號的相位,atan2(192, 3.4315E-12)=1.5708弧度,換算成角度就是180*1.5708/pi=90.0002。可見,相位也是對的。根據FFT結果以及上面的分析計算,我們就可以寫出訊號的表示式了,它就是我們開始提供的訊號。



總結:假設取樣頻率為Fs,取樣點數為N,做FFT之後,某一點n(n從1開始)表示的頻率為:Fn=(n-1)*Fs/N;該點的模值除以N/2就是對應該頻率下的訊號的幅度(對於直流訊號是除以N);該點的相位即是對應該頻率下的訊號的相位。相位的計算可用函式atan2(b,a)計算。atan2(b,a)是求座標為(a,b)點的角度值,範圍從-pi到pi。要精確到xHz,則需要取樣長度為1/x秒的訊號,並做FFT。要提高頻率解析度,就需要增加取樣點數,這在一些實際的應用中是不現實的,需要在較短的時間內完成分析。解決這個問題的方法有頻率細分法,比較簡單的方法是取樣比較短時間的訊號,然後在後面補充一定數量的0,使其長度達到需要的點數,再做FFT,這在一定程度上能夠提高頻率分辨力。具體的頻率細分法可參考相關文獻。