1. 程式人生 > >VoIP技術(5)--VoIP語音質量MOS-PESQ-PSQM

VoIP技術(5)--VoIP語音質量MOS-PESQ-PSQM

6.語音質量評估方案

經驗顯示,如果系統可以提供更多的其他服務,網路電話使用者可接受比目前公眾電話網路略差的通話品質。

IUT-T P.800中定義了MOS的測量方法,但該方法成本太高,費時太長;因此,在後來的研究和探索中,先後出現其他幾種客觀測量方法。ITU-T P.861定義了PSQM /PSQM+Perceptual Speed Quality Measure,感知通話質量測量。ITU-T P.862定義了PESQPerceptual Evaluation of Speed Quality,感知評估通話質量測量。英國電信定義了PAMSPerceptual Analysis Measurement System

,感知分析測量。ITU-T G.107定義了E-Model測量方法,它克服了PSQM/PESQ等測量方法的缺點(如:不是基於IP網路的方法,不能反應IP網路的衰減問題,如網路傳輸中的DelayJitterPacket Loss等問題;不能說明End-to-End的網路延遲,只能輸出在任何時間內的某一方向的語音質量,不是真實通話中的雙向結果),因此E-Model非常適合VoIP語音質量的測量。

此外,平均主觀值MOS是廣泛認同的語音質量標準。因此,無論採用何種方法,所有測量方法所得到的結果都必須對應到最終的平均主觀值MOS

6.1 MOS

每個編解碼提供特定的語音質量。所傳輸的語音質量是接聽者的主觀反應的平均評價結果

(MOS, mean opinion score)。使用MOS,大量的接聽者按5分制(1為最差, 5為出色)判斷語音樣本(對應於特定編解碼)的質量,平均其結果來提供該樣本的平均評價結果。下圖解釋了CODECMOS得分之間的關係。

13 壓縮方法和MOS得分

注意圖4和表1之間的資料有一些衝突,取決於不同的試驗條件。

雖然從費用觀點來看,使用低位速率編解碼演算法,以節省基礎投資,似乎是合乎邏輯的。但是使用者在設計低位速率壓縮語音網路時應該考慮更多的因素。壓縮語音有一些缺點,其中一個主要缺點是由於多重編碼(稱為串聯編碼)而引起的語音失真。例如,G729語音訊號被串聯編碼三次後,MOS的結果從

3.92()降低到2.68(不可接受)。使用低位速率的另一個缺點是壓縮解壓縮所帶來的延遲。

6.2 PESQ

PSQMPAMS的開發者KPN Research與英國電訊最近共同合作提出新的客觀語音品質評量ITU-T標準,稱為語音質量感知評估(Perceptual Evaluation of Speech quality, PESQ),這項技術結合PSQMPAMS兩種方法的優點—PSQM的聽覺模型(perceptual model)PAMS的時間對位法(time-alignment routine)所以PESQ指標與MOS指標g之間的相關性將更高。 PESQ分數範圍從1(最差)4.5(最好)3.8代表一般傳統付費電話的可接受語音品質。

6.3 PSQM/PSQM+

PSQM演演算法是以06.5的數字來評量清晰度,數字越低代表通話品質越好。PSQM原本是設計用來評估和比較各種語音編碼(speech codecs)技術的優劣,而非點對點的(end-to-end)網路通話品質。但是,加強許多功能之後(稱為PSQM+)便可用來作為網路通話品質測試,在比較PSQMMOS的時候必須特別注意,PSQM與傳統MOS聽音品質間的關係並非線性。