1. 程式人生 > >人工智能-語音合成-語音識別

人工智能-語音合成-語音識別

AC app appid document pre aip instance class OS

圖靈機器人:

http://www.tuling123.com

百度開發平臺:

http://ai.baidu.com/

下載

baidu-api

如果已安裝pip,執行pip install baidu-aip即可。技術分享圖片

ffmpeg 先下載文件,再配置到系統路徑

技術分享圖片

技術分享圖片

技術分享圖片

下載完安裝包,解壓後,將該絕對路徑 配置到系統路徑。

技術分享圖片

配置成功如下:

技術分享圖片

打開電腦的錄音機。

技術分享圖片

jieba中文分詞

技術分享圖片

技術分享圖片 技術分享圖片

1.

技術分享圖片

2.創建應用

技術分享圖片

3.自動生成

技術分享圖片

4.

技術分享圖片

語音合成

1.

技術分享圖片

2.復制代碼到一個新的py文件中。

技術分享圖片

技術分享圖片

3.右鍵運行,即可將文字轉成語音。

技術分享圖片

代碼:

技術分享圖片
# 語言合成  文字 ->語音

from aip import AipSpeech

""" 你的 APPID AK SK """
APP_ID = 11262331
API_KEY = Weu6QCLgU8oCPvULqpOSer7c
SECRET_KEY = wMThGsaL8NPdNgE6z4A3Rmes1DvWNBO1

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)


result  
= client.synthesis(你好呀,我的貝貝, zh, 1, { vol: 5, spd: 6, pit: 3, vol: 9, per: 4 }) # 識別正確返回語音二進制 錯誤則返回dict 參照下面錯誤碼 if not isinstance(result, dict): with open(貝貝.mp3, wb) as f: f.write(result)
語音合成

語音識別

1.SDK文檔

技術分享圖片

2.復制代碼到一個新的py文件中。

技術分享圖片

技術分享圖片

3.代碼:

技術分享圖片
import os

cmd = "ffmpeg -y -i %s -acodec pcm_s16le -f s16le -ac 1 -ar 16000 %s"%("貝貝.mp3","貝貝.pcm")

os.system(cmd)
pcm

技術分享圖片

4.在cmd中先運行該文件,轉換語音的格式為pcm格式。

技術分享圖片

5.右鍵運行即可

技術分享圖片

人工智能-語音合成-語音識別