1. 程式人生 > >Sigmoid非線性啟用函式,FM調頻,膽機,HDR的意義

Sigmoid非線性啟用函式,FM調頻,膽機,HDR的意義

        前幾天家裡買了個二手車子,較老,發現只有FM收音機,但音響效果不錯,車子帶藍芽轉FM,可以手機藍芽播放音樂,但經過幾次轉換以及對FM的質疑,所以懷疑音質是否會劇烈下降,抱著試試的態度放了一個手機上的音樂,結果感動的流淚了,為什麼以前手機帶的高保真耳機中遺失了那麼多精彩內容,高保真音響,高保真功放.....為何不敵即將淘汰的車載的FM...

          記得中學的時候經常看電子類書籍,對各種音響電路都很著迷,那是後流行高保真這一概念,各種訊號補償帶通濾波反饋控制演算法,就為了讓聲音能夠真實的還原出來,特別鄙視那些玩膽機的人,認為他們不懂理論,只是固執與迷信,後來學習神經網路知道了人類神經元的Sigmoid啟用函式,但不慎理解,認為這是人類感官系統的缺陷,工作在非線性的模式分類中將失去認識真實世界的能力。

 

  由於FM帶來的震撼,我不得不對以前學習過的人類神經元原理做出新的認識,神經元對訊號強度做收集和分類,其分類的邊界控制由啟用函式來確定,Sigmoid啟用函式由三部分工作區域組成。




第一部分是在正常訊號輸入的線性工作區,輸入訊號的強度與模式分類線性相關,意即我們人類可以準確識別出訊號的物理強度,對訊號的變化很敏感。


第二部分則是在較弱和較強的訊號輸入的非線性工作區,這個區間的訊號在做模式分類時人類則不能準確識別訊號的物理強度,10倍物理強度差別的訊號對於我們來講可能差別微乎其微,僅僅能識別出微弱的差別。


第三部分是超過神經元感測器工作閾值的截止區,這個區域無論訊號強度如何變化,我們都將不能區別出其強度差別。

 

 接下來看看FM做了什麼,他為何將Mp3音樂中一些消失殆盡的場景再次還原出來,讓我的耳朵變得年輕了。


 

上圖是FM調頻器件變容二極體的振幅頻率特性曲線(沒有找到直接的圖片),這個圖說明什麼呢,他說明小功率訊號可以獲得更多的增益,而大功率訊號則被抑制,結合人類感知Sigmoid啟用函式來看,其意義就是工作在非線性工作區微弱的不能敏感體會到的細節音樂拉進可以敏感識別的Sigmoid線性工作區,同樣將聲音大不能體現其變化細節的音樂也拉近Sigmoid線性工作區,因此經過FM非線性調頻後,我們將獲得飽滿的聲場,這將不再是迷信。


同樣具備非線性放大的功放的還有膽機,為什麼很多是前膽後石,原因是膽做了非線性放大(失真變換),將聲場變換到Sigmoid

線性工作區,之後再交給石機做高保真(線性)的功率放大(膽機電流小,無法做功率推動)。


如果你對聲音不敏感,那麼你應該對HDR以及超級夜景圖片敏感吧,HDR圖片將高動態範圍中感光較強的訊號做抑制(降低曝光度),將暗光訊號微弱的訊號做加強曝光,然後將兩種訊號混合得到人眼能夠觀察到細節的強度範圍上來。


因此FM 膽機相當於音訊領域的HDR,由於神經元的Sigmoid啟用特性,實際上保真對於人類感官來講意義並不是太大了,能夠通過失真變化得到更多的場景內容則變得更加有意義。