1. 程式人生 > >談談視訊會議系統中影響音視訊效果的因素

談談視訊會議系統中影響音視訊效果的因素

 在視訊會議系統的應用中,影響視音訊效果的因素主要集中在三個方面:

1)網路的服務質量;

2)MCU和終端的效能;

3)會議室的設計。

一、網路的服務質量(QoS)

    目前,視訊會議系統常用的網路主要有E1專線和IP兩種。E1專線基於電路交換和時分複用技術,能夠提供端到端的獨享頻寬,因此網路本身具有完善的傳輸質量保障機制。在絕大多數情況下,影響E1專線傳輸效果的主要因素就是傳輸裝置和傳輸線路的質量。對於這類因素,我們往往可以通過更換傳輸裝置和降低線路誤位元速率進行改善。

    而IP網基於統計複用和分組交換技術,在需要同時傳輸語音、資料以及視訊等多種業務時,其傳統的“盡力傳遞”機制暴露出很多問題,其中最重要的一點就是無法為每一種業務提供端到端的頻寬保證,會導致較大的傳輸延時和抖動。為此,我們必須通過技術手段對IP網進行優化,以減少網路本身對視訊會議系統效果的影響。這些技術手段目前已經發展為IP體系中的一個重要分支,就是服務質量(QoS)。

    所謂QoS,是指一個網路通過多種技術為某一特定的網路流量提供更好服務的能力,它的主要目的是實現優先權控制,包括頻寬、延時、抖動以及丟包等多個方面。幾乎所有的網路都可以利用QoS的優勢來獲得最佳的效率。

    QoS技術分為三類,包括盡力而為服務、整合服務、差分服務,其中差分服務應用最廣泛。在差分服務中,網路根據每一個數據包的QoS標記對資料包進行分類、排隊和管理。這些標記可以是IP地址、TCP埠號或IP資料包中的特定欄位。

    在實際的網路規劃中,就要求網路裝置(如路由器)能夠藉助於複雜的流量管理系統,通過多種技術提供QoS保證機制,根據業務型別劃分不同的優先等級,比如語音最優、視訊其次、資料最後,然後根據這些優先級別分配網路資源。

    對於視訊會議而言,為了保證視訊業務的頻寬,路由器必須能夠在通過的IP資料流中識別出視訊業務資料包並對其分類,然後再通過擁塞管理機制提供頻寬保證和優先傳遞服務。這樣,在網路發生擁塞時,就可以保證語音和視訊業務的傳輸效果了。目前主流路由器廠商均可提供基於分類、標記與擁塞管理的QoS支援。

二、MCU和終端的效能

    除了網路應該提供良好的QoS保障機制外,視訊會議系統裝置本身也應該具有良好的效能才能真正保證會議的效果。這些效能因素包括系統採用的視音訊編解碼技術、裝置的設計結構、裝置本身對惡劣網路環境的適應能力以及其他方面。

1、視音訊編解碼技術

    視音訊編碼技術是視訊會議系統的關鍵技術指標,是影響會議效果的重要因素。目前視訊會議系統中用到的視訊編碼技術主要有H.261、H.263、H.264、MPEG-2、MPEG-4等,音訊編碼技術主要有G.711、G.722、G.728、G.729、MP3等。

    其中,H.264和MPEG-4這兩種視訊編碼技術能夠在低頻寬下實現高清晰的動態影象效果,而且編碼延時小,作為新一代視訊編解碼標準,其優勢非常明顯。

    AnyChat採用國際領先的視訊編碼標準H.264(MPEG-4 part 10 AVC /H.264)編碼,H.264/AVC 在壓縮效率方面有著特殊的表現,一般情況下達到 MPEG-2 及 MPEG-4 簡化類壓縮效率的大約 2 倍。

    H.264具有許多與舊標準不同的新功能,它們一起實現了編碼效率的提高。特別是在幀內預測與編碼、幀間預測與編碼、可變向量塊大小、四分之一畫素運動估計、多參考幀預測、自適應環路去塊濾波器、整數變換、量化與變換系數掃描、熵編碼、加權預測等實現上都有其獨特的考慮。

    而在音訊編碼方面,MP3是一種高效的聲音壓縮演算法,其頻響範圍在20Hz到20KHz之間,取樣頻率達到44.1KHz,而且支援雙聲道編碼,因此正在獲得越來越廣泛的應用。

2、裝置的設計結構

    早期有很多視訊會議系統中的MCU和終端均採用PC作為硬體結構,作業系統則基於Windows。這類裝置在編解碼效能、包轉發效率以及穩定性、安全性等方面均存在很大的侷限性,導致會議視音訊質量不高、延時較大。

    作為專業的會議室型應用,絕大多數視訊會議系統現在都選擇基於嵌入式設計結構的MCU和終端裝置。這主要是因為嵌入式系統指令精簡、實時性高,結合專用的編解碼DSP,可實現高品質、低延時的視音訊訊號處理,而且穩定性、安全性也高。

3、裝置對惡劣網路環境的適應能力

    網路的QoS可以在一定程度上保證視訊會議的傳輸效果,但其作用是很有限的,尤其是在一些較為惡劣的網路環境下。視訊會議系統裝置本身對惡劣網路環境的適應能力也將對會議效果產生較大的影響。這些適應能力包括IP優先權設定、IP包排序、IP包重複控制、IP包抖動控制、丟包重傳以及速率自動調整等。

1)IP優先權(IP Precedence)

    在網路規劃差分服務方式的QoS技術時,可通過多種匹配手段對進入資料網的業務包進行分類,包括IP地址、IP 優先權(IP Precedence)等。

    其中,利用IP包中的IP優先權部分可以對音訊、視訊和RTCP(Multicast)資料流進行優先順序劃分。當網路採用IP Precedence進行流量匹配時,可通過視訊裝置發出的修改過IP Precedence欄位資訊的視音訊包進行入佇列處理,以保證視訊會議碼流的優先傳送。

2)IP包排序

    通常,網路的盡力傳遞機制無法保證其轉發的資料包的正確次序。對於H.323視訊會議系統,如果視訊裝置按次序接收IP包,將帶來錯序問題,資料包的丟失或延遲將導致視訊影象的凍結或聲音的中斷或抖動。

    可通過視訊裝置支援IP包排序功能解決該問題,當IP包到達時,視訊裝置將對其次序進行驗證,無序的包被退回,以維護髮送給終端使用者的音訊和視訊流的連續性。

3)IP包重複控制

    一個IP包經過承載網時可能會產生多個重複的副本,或為了適應惡劣網路環境系統可能採用重傳機制時也會產生多個重複的副本,這樣將引起視訊影象的凍結或聲音中斷。支援IP包重複控制的視訊裝置可通過該功能來糾正該錯誤,以維護髮送給終端使用者的音訊和視訊流的連續性。

4)抖動控制

    當音訊和視訊IP包離開發送端時,按照規則的間隔均勻的排列。在通過網路之後,這一均勻的間隔因不同的延時大小而遭到破壞,從而產生抖動。抖動會導致目標終端上音訊和視訊流的不連貫性。支援抖動控制的視訊裝置可通過抖動快取來實現抖動消除,以維護終端使用者接收到的音訊和視訊流的連貫性。

5)丟包重傳

    當網路擁塞嚴重時,網路裝置(如路由器)會根據快取大小並配合相關處理機制丟掉一些視訊包,視訊會議系統中視訊包是採用UDP協議進行傳輸的,而UDP本身沒有重傳機制,因此會導致接收端出現影象丟幀或馬賽克現象。支援丟包重傳的視訊裝置可通過新增丟包檢測和重傳的機制來保證會議影象的連貫性。

6)自動速率調整技術

    在一些惡劣的網路環境下,降低會議位元速率將有助於提高視音訊的連貫性和實際效果。如果視訊裝置支援動態速率調整技術,可以使終端和MCU能通過檢測網路上有利和不利的因素來自動適應網路的容量和效能,通過動態調整視訊會議的位元速率,為終端使用者提供儘可能好的視訊質量。

    視訊裝置的自適應頻寬調整功能主要是通過檢測資料包丟失率來實現的。如果終端檢測到資料包丟失率超過了指定的閥值,它將自動降低視訊會議位元速率,同時通知其它參會終端做相同的動作,從而提供一個具有最優視音訊效果的會議位元速率。

7)脣音同步技術

    視訊會議系統中視訊訊號和音訊訊號是分別編碼、分別傳輸的,由於IP優先順序和視音訊包大小等因素的影響,會使視音訊的同步包到達順序不同,引起脣音不同步。

    影響脣音不同步主要有兩種因素:網路傳輸時延和視音訊處理時延不同。

    當音訊和視訊包離開發送端時,音訊包與對應的視訊包保持同步。但是,在通過承載網時,各種佇列演算法會對音訊資料包和視訊資料包進行不同的處理。這將打亂音訊資料包與相應的視訊資料包的同步關係。最終的結果導致聲音與口型失去同步。支援脣音同步的視訊裝置可通過使用IP包中的RTP時間戳資訊來糾正這一問題。利用RTP時間戳,裝置能夠確定哪一音訊包與哪一視訊包對應。進一步重新調整相應的視音訊包,以保證聲音與口型的同步。

    在傳送端,處理音訊所花費的時間不同於處理視訊所花費的時間。影響這一問題的因素包括聲速與光速的不同、房間的大小和形狀、音訊和視訊編碼的演算法的複雜性。為了避免時間差,支援脣音同步的裝置可通過在音訊流的出發點增加一定的延遲,以獲得聲音與口型的同步;也可在接收端增加或減少音訊延遲,以糾正傳送端不恰當的延遲設定。這樣就保證遠端會場在接收視訊會議聲音和影象時,實現脣音同步。

  包含了音視訊處理模組(採集、編解碼)、流媒體管理模組(丟包重傳、抖動平滑、動態緩衝)、流媒體播放模組(多路混音、音視訊同步)以及P2P網路模組(NAT穿透、UPnP支援)等多個子模組,封裝了底層的硬體操作(音視訊採集、播放)、封裝了流媒體處理(編解碼、網路傳輸)等非常專業和複雜的技術,為上層應用提供簡單的API控制介面,可以在極短的開發週期,以及極少的人力資源投入下為客戶的現有平臺增加音視訊即時通訊、多方會議的功能。

4、音訊處理技術

1)自動回聲抑制

    召開多點視訊會議時,每一個會場的聲音編碼器都將音訊包向MCU傳輸,而MCU將發言會場的音訊包向所有其他會場廣播,當視訊會議終端接收音訊包時,將解碼後的音訊流與本地輸入的音訊流進行電平比較,去掉相同的部分,這樣本地的聲音就不會在自己的會場揚聲器傳出,引起音訊的振盪,從而避免回聲。

    佰銳科技技術人員長期致力於語音技術的研發,在迴音消除技術領域不斷的優化與創新,擁用國內屈指可數,為數不多的音訊技術研發團隊。

2)自動增益控制

    由於優先視訊會議使全向式麥克風,放置在會場的中心位置,這樣每一個發言人由於距離麥克風的位置不同,麥克風接受到的電平也不同。

    為了保證傳向遠端的音訊電平的平穩,在進行編碼時要進行音訊的增益處理,以保證一定範圍內的發言人以同一個音調發言,這樣遠端會場的聲音就不會忽高忽低。

3)背景噪音消除

    召開會議時不可避免地會有一些環境噪音,例如空調、風扇、交流電等電器裝置持續發出的環境噪音,這些聲音嚴重的影響了會議的音訊質量。

    自動噪聲抑制系統會根據音訊的高低、持續情況,判斷是否為環境噪音,並且進行處理,以達到良好的聲音會議效果。

三、會議室的設計

    會議室的設計也是影響視訊會議效果的重要因素之一,包括會場裝置、會場佈局、會場環境等。會議室的設計涉及的內容非常廣泛,限於篇幅,我們下面僅列出部分因素及建議。

    會場裝置包括攝像機、電視機、話筒以及音響系統等具體的視音訊訊號輸入、輸出裝置。結合不同的會場佈局和裝修條件,這些裝置在配置上都應該有所差異,才能真正保證會議效果。比如,會場的擴聲系統必須與會場佈局進行很好的配合才能真正保證其效果,專業的擴聲系統設計依賴於複雜的聲場測試與反覆除錯過程。

    會場佈局包括總體設計、會場面積、會場裝修等:

1)會場的總體設計要能逼真地反映現場人物和景物,使與會者有臨場感,以達到視覺與語言資訊交流的良好效果,會議室中傳送的影象包括人物、景象、圖表、文字等,應當清晰可辨;

2)會場的面積建議按平均每人2.2平方米計算;

3)為了防止顏色對人物攝像產生的“奪光”及“反光”效應,故背景牆應具有均勻的淺顏色,通常多采用米色或灰色,以使攝像機鏡頭光圈設定合適,而房間的其他三面牆壁、地板、天花板等均忌用黑或鮮豔色彩的飽和色,通常採用淺藍色、淺灰色等,每面牆都不適宜用複雜的圖案話或掛複雜的畫幅,以免攝像機移動或變焦時影象產生模糊現象,並增加編碼開銷;

4)會議桌布置採用排式。為減少面部陰影,要求採用淺色桌面或桌布,在麥克風和桌面之間最好加一層軟性材料,以免造成敲擊桌面時造成太大的響動;

5)儘量採用舒適的椅子,同時椅子不要裝小腳輪,限制移動,以防止離開鏡頭;

6)為了保證聲絕緣,地上應鋪上地毯,天花板應裝消音板,四周牆壁應裝隔音毯,窗子應安裝雙層玻璃,桌子鋪上桌布;

7)燈光照度是視訊會議會議室的一個基本的必要條件,由於電視會議召開時間具有隨機性,故室內應用人工冷光源避免自然光。會議室的門窗需用深色窗簾遮擋。光源對人眼視覺無不良影響。選擇三基色燈(色溫3500K)較為適宜。

    會場環境包括室內環境和周圍環境:

1)會議室內應安裝空調,以創造穩定的溫度、溼度環境,空調的噪聲應該比較低,如室內空調噪聲過大,就會大大影響該會場的音訊效果。會議室內空氣應流通;

2)會議室應設定在遠離外界嘈雜、喧譁的位置。會議室的設定應符合防止洩密,便於使用和儘量減少外來噪聲干擾的要求。