1. 程式人生 > >python 播放音訊與錄音

python 播放音訊與錄音

音訊預處理

這一講主要介紹些音訊基本處理方式,為接下來的語音識別打基礎。

三種播放音訊的方式

使用 python 播放音訊有以下幾種方式:

os.system()

python 播放音訊與錄音

 

os.system(file) 呼叫系統應用來開啟檔案,file 可為圖片或者音訊檔案。

缺點:要開啟具體的應用,不能在後臺播放音訊。

pyaudio

安裝:pip install pyaudio

官方提供了播放音訊與錄音的 api ,使用十分方便,只要把Filename更改為你的音訊檔案的文字,就可以播放音訊了。

"""PyAudio Example: Play a WAVE file."""
import pyaudio
import wave
CHUNK = 1024
FILENAME = '你的音訊檔案'
def play(filename = FILENAME):
 wf = wave.open(filename, 'rb')
 p = pyaudio.PyAudio()
 stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
 channels=wf.getnchannels(),
 rate=wf.getframerate(),
 output=True)
 data = wf.readframes(CHUNK)
 while data != b'':
 stream.write(data)
 data = wf.readframes(CHUNK)
 stream.stop_stream()
 stream.close()
 p.terminate()

jupyter notebook

在 jupyer notebook 中播放音訊可以使用以下函式:

import IPython.display as ipd
ipd.Audio(檔名)

幾種讀取音訊的方式

python 有很多讀取音訊檔案的方法,內建的庫 wave ,科學計算庫 scipy, 和方便易用的語音處理庫 librosa。

下面將介紹分別使用這幾種庫讀取音訊檔案:

安裝:

wave 是內建庫直接匯入即可。

scipy: pip install scipy

librosa: pip install librosa

使用:

wave.open:

引數 path 為檔名,mode 為開啟方式

以'rb'方式開啟檔案返回一個 Wave_read 物件,而以'wb'方式開啟檔案返回一個 Wave_write 物件。

scipy.io.wavfile:

引數 path 為檔名

返回 rate : 取樣率(每秒取樣點的個數),data : 音訊資料

librosa.load:

引數 path 為檔名

返回 y 為音訊資料,sr 為取樣率

# read wav file from path
from scipy.io import wavfile
import librosa
import pyaudio
# wave
file = wave.open(path,'rb')
# wavfile
rate, data = wavfile.read(path)
# librosa
y, sr = librosa.load(path)

下面演示一個使用 wavfile 讀取音訊檔案並且畫出波形的例子:

首先要計算音訊到底持續了多長時間,wave 的 shape 就是總的取樣點個數,除以取樣頻率可以得到持續的總時間(秒),乘1000得到總持續時間(毫秒)。接著通過 np.linsapce 產生時間的序列,最後使用 matplotlib 畫出影象。

from scipy.io import wavfile
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline
# 一秒取樣數
sr, wave = wavfile.read('D://QQPCMgr/Desktop/python3/skip.wav')
sample_number = wave.shape[0]
total_time = int(sample_number / sr * 1000)
time_series = np.linspace(0,total_time,sample_number)
fig, ax = plt.subplots(1, 1)
ax.plot(time_series, wave)
ax.set_title('Time*Amplitude')
ax.set_xlabel('Time/ms')
ax.set_ylabel('Amplitude/dB')

python 播放音訊與錄音

 

 

最後再借用 pyaudio 的 api 我們可以實現連續錄音功能:

python 實現錄音功能

其中,函式 multi_record每結束一次錄音會詢問 “是否進行下一次錄音?”,按回車就可以進行下一次錄音了。

import wave
import pyaudio
import matplotlib.pyplot as plt
import time
CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5
def record(filename='output.wav'):
 """官方錄音教程
 """
 
 p = pyaudio.PyAudio()
 
 stream = p.open(format=FORMAT,
 channels=CHANNELS,
 rate=RATE,
 input=True,
 frames_per_buffer=CHUNK)
 
 print("* recording")
 
 frames = []
 for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
 data = stream.read(CHUNK)
 frames.append(data)
 
 print("* done recording")
 
 stream.stop_stream()
 stream.close()
 p.terminate()
 
 wf = wave.open(filename, 'wb')
 wf.setnchannels(CHANNELS)
 wf.setsampwidth(p.get_sample_size(FORMAT))
 wf.setframerate(RATE)
 wf.writeframes(b''.join(frames))
 wf.close()
def multi_record(num=3):
 """implement 多次錄音"""
 for i in range(1,num+1):
 print('第{}次錄音準備'.format(i))
 filename = 'record_{}.wav'.format(i)
 record(filename)
 time.sleep(second)
 _ = input('進行下一次錄音?')
def main():
 multi_record()
if __name__ == '__main__':
 main()