1. 程式人生 > >視聽覺訊號與處理·實驗一

視聽覺訊號與處理·實驗一

一.幀時長計算

通俗的講取樣頻率是指計算機每秒鐘採集多少個訊號樣本,比如聲音訊號,此時取樣頻率可以是描述聲音檔案的音質、音調,衡量音效卡、聲音檔案的質量標準。取樣頻率越高,即取樣的間隔時間越短,則在單位時間內計算機得到的樣本資料就越多,對訊號波形的表示也越精確。取樣頻率與原始訊號頻率之間有一定的關係,根據奈奎斯特理論,
只有取樣頻率高於原始訊號最高頻率的兩倍時,才能把數字訊號表示的訊號還原成為原來訊號。在數字音訊領域,常用的取樣率有:
8000Hz 電話所用取樣率,對於人的說話已經足夠
11025Hz 獲得的聲音稱為電話音質,基本上能讓你分辨出通話人的聲音
22050Hz 無線電廣播所用取樣率,廣播音質

https://baike.baidu.com/item/取樣頻率/1494233?fr=aladdin
從而,計算幀時長的方法:
假設幀長=256個取樣點,取樣頻率為:fs=16000.則一秒採了16000個樣本.
一幀時長=1/16000256=0.0165625s。
寫成matlab程式碼:
frameTime=1/fs
frameLength;

二.端點檢測原理

在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
在這裡插入圖片描述
那麼這個閾值要怎麼選呢?這個門限的選取是遵從什麼樣的規則呢。
在這裡插入圖片描述

這裡的E是過零率,M是平均幅度,E是能量。 S是無聲,U是清音,V是濁音。 其中清音過零率最大,濁音能量最大。

在這裡插入圖片描述
由上圖可以看到,
雙門限法:
(1)用較高的短時能量門限Mh確保是濁音。確定為A1-A2
(2)短時能量>較低的門:M1的還是語音段。確定為B1-B2
(3)從B1開始向前搜尋,短時過零率>門限Zs的是清音部分。
從B2向後搜尋,短時過零率>門限Zs的是清音部分。
那這裡的MH,ML,Zs怎麼確定呢。