1. 程式人生 > >微信小程式語音轉化為文字

微信小程式語音轉化為文字

1、微信小程序錄音,提交到伺服器(此時音訊格式為silk);

2、利用silk-v3-decoder(https://github.com/kn007/silk-v3-decoder), 把silk 轉換成pcm格式 (silk/decoder  /data/test.silk  /data/1.pcm);

3、 用 ffmpeg  把 44100 取樣率 單聲道 16bts pcm 檔案轉 16000取樣率 16bits 位深的單聲道pcm檔案 

ffmpeg -y -f s16le -ac 1-ar 44100-i test44.pcm -acodec pcm_s16le -f s16le -ac 1-ar 1600016k.pcm (獲得pcm檔案)

ffmpeg -y -f s16le -ar 24000 -ac 1 -i /data/1.pcm -f wav -ar 16000 -b:a 16 -ac 1 /data/1.wav  (獲得wav檔案)

4、呼叫百度api 轉換 pcm , 就能獲取百度轉換後的 文字

注:取樣率很重要,錯了百度api將無法轉換,必須為8000或16000