人工智能-語音合成-語音識別
阿新 • • 發佈:2018-05-18
AC app appid document pre aip instance class OS
圖靈機器人:
http://www.tuling123.com
百度開發平臺:
http://ai.baidu.com/
下載
baidu-api
如果已安裝pip,執行pip install baidu-aip
即可。
ffmpeg 先下載文件,再配置到系統路徑
下載完安裝包,解壓後,將該絕對路徑 配置到系統路徑。
配置成功如下:
打開電腦的錄音機。
jieba中文分詞
1.
2.創建應用
3.自動生成
4.
語音合成
1.
2.復制代碼到一個新的py文件中。
3.右鍵運行,即可將文字轉成語音。
代碼:
# 語言合成 文字 ->語音 from aip import AipSpeech """ 你的 APPID AK SK """ APP_ID = ‘11262331‘ API_KEY = ‘Weu6QCLgU8oCPvULqpOSer7c‘ SECRET_KEY = ‘wMThGsaL8NPdNgE6z4A3Rmes1DvWNBO1‘ client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) result語音合成= client.synthesis(‘你好呀,我的貝貝‘, ‘zh‘, 1, { ‘vol‘: 5, ‘spd‘: 6, ‘pit‘: 3, ‘vol‘: 9, ‘per‘: 4 }) # 識別正確返回語音二進制 錯誤則返回dict 參照下面錯誤碼 if not isinstance(result, dict): with open(‘貝貝.mp3‘, ‘wb‘) as f: f.write(result)
語音識別
1.SDK文檔
2.復制代碼到一個新的py文件中。
3.代碼:
import os cmd = "ffmpeg -y -i %s -acodec pcm_s16le -f s16le -ac 1 -ar 16000 %s"%("貝貝.mp3","貝貝.pcm") os.system(cmd)pcm
4.在cmd中先運行該文件,轉換語音的格式為pcm格式。
5.右鍵運行即可
人工智能-語音合成-語音識別