Python如何實現文字轉語音

阿新 • • 發佈：2020-12-12

準備

我測試使用的Python版本為2.7.10，如果你的版本是Python3.5的話，這裡就不太適合了。

使用Speech API

原理

我們的想法是藉助微軟的語音介面，所以我們肯定是要進行呼叫相關的介面。所以我們需要安裝pywin32來幫助我們完成這一個底層的互動。

示例程式碼

1 2 3 import win32com.client speaker = win32com.client.Dispatch("SAPI.SpVoice") speaker.Speak("Hello, it works!")

小總結

是的，呼叫介面來實現語音功能就是這麼簡單，但是我們不得不來聊一聊這種方式的缺點。

對中文支援的不夠好，僅僅是這一點，估計在中國沒幾個用它的了。

還有就是語速不能很好的控制

pyttsx方式

原理

pyttsx 是Python的一個關於文字轉語音方面的很不錯的庫。我們還可以藉助pyttsx來實現線上朗讀rfc檔案或者本地檔案等等，最為關鍵的是，它對中文支援的還是不錯的。

示例程式碼

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

# coding:utf-8 import sys reload(sys) sys.setdefaultencoding('utf8') # __author__ = '郭璞' # __date__ = '2016/8/6'

# __Desc__ = 文字轉語音輸出 import pyttsx engine = pyttsx.init() engine.say('hello world') engine.say('你好，郭璞') engine.runAndWait() # 朗讀一次 engine.endLoop()

小總結

使用pyttsx，我們可以藉助其強大的API來實現我們基本的業務需求。很酷吧。

pyttsx深入研究

做完上面的小實驗，你肯定會覺得怎麼這麼不過癮呢？
別擔心，下面我們就一起走進pyttsx的世界，深入的研究一下其工作原理吧。

語音引擎工廠

類似於設計模式中的“工廠模式”，pyttsx通過初始化來獲取語音引擎。當我們第一次呼叫init操作的時候，會返回一個pyttsx的engine物件，再次呼叫的時候，如果存在engine物件例項，就會使用現有的，否則再重新建立一個。

1	`pyttsx.init([driverName : string, debug :` `bool]) → pyttsx.Engine`

從方法宣告上來看，第一個引數指定的是語音驅動的名稱，這個在底層適合作業系統密切相關的。如下：

1.drivename：由pyttsx.driver模組根據作業系統型別來呼叫，預設使用當前作業系統可以使用的最好的驅動

sapi5 - SAPI5 on Windows

nsss - NSSpeechSynthesizer on Mac OS X

espeak - eSpeak on every other platform

2.debug:這第二個引數是指定要不要以除錯狀態輸出，建議開發階段設定為True

引擎介面

要想很好的運用一個庫，不瞭解其API是不行的。下面來看看pyttsx。engine.Engine的引擎API。

方法簽名	引數列表	返回值	簡單釋義
connect(topic : string, cb : callable)	topic：要描述的事件名稱；cb:回撥函式	→ dict	在給定的topic上添加回調通知
disconnect(token : dict)	token:回撥失聯的返回標記	Void	結束連線
endLoop()	None	→ None	簡單來說就是結束事件迴圈
getProperty(name : string)	name有這些列舉值“rate, vioce,vioces,volumn	→ object	獲取當前引擎例項的屬性值
setProperty(name : string)	name有這些列舉值“rate, vioce,vioces,volumn	→ object	設定當前引擎例項的屬性值
say(text : unicode, name : string)	text:要進行朗讀的文字資料; name：關聯發音人，一般用不到	→ None	預設要朗讀的文字資料，這也是“萬事俱備，只欠東風”中的“萬事俱備”
runAndWait()	None	→ None	這個方法就是“東風”了。當事件佇列中事件全部清空的時候返回
startLoop([useDriverLoop : bool])	useDriverLoop:是否啟用驅動迴圈	→ None	開啟事件佇列

元資料音調

在pyttsx.voice.Voice中，處理合成器的發音。

age

發音人的年齡，預設為None

gender

以字串為型別的發音人性別: male, female, or neutral.預設為None

關於Voice的字串確認資訊. 通過 pyttsx.engine.Engine.setPropertyValue()來設定活動發音簽名. 這個屬性總是被定義。

languages

發音支援的語言列表，如果沒有，則為一個空的列表。

name

發音人名稱，預設為None.

更多測試

朗讀文字

1 2 3 4 5 import pyttsx engine = pyttsx.init() engine.say('Sally sells seashells by the seashore.') engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()

事件監聽

1 2 3 4 5 6 7 8 9 10 import pyttsx def onStart(name): print 'starting', name def onWord(name, location, length): print 'word', name, location, length def onEnd(name, completed): print 'finishing', name, completed engine = pyttsx.init() engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()

打斷髮音

1 2 3 4 5 6 7 8 import pyttsx def onWord(name, location, length): print 'word', name, location, length if location > 10: engine.stop() engine = pyttsx.init() engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()

更換髮音人聲音

1 2 3 4 5 6 engine = pyttsx.init() voices = engine.getProperty('voices') for voice in voices: engine.setProperty('voice', voice.id) engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()

語速控制

1 2 3 4 5 engine = pyttsx.init() rate = engine.getProperty('rate') engine.setProperty('rate', rate+50) engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()

音量控制

1 2 3 4 5 engine = pyttsx.init() volume = engine.getProperty('volume') engine.setProperty('volume', volume-0.25) engine.say('The quick brown fox jumped over the lazy dog.') engine.runAndWait()

執行一個事件驅動迴圈

1 2 3 4 5 6 7 8 9 10 11 12 13 14 engine = pyttsx.init() def onStart(name): print 'starting', name def onWord(name, location, length): print 'word', name, location, length def onEnd(name, completed): print 'finishing', name, completed if name == 'fox': engine.say('What a lazy dog!', 'dog') elif name == 'dog': engine.endLoop() engine = pyttsx.init() engine.say('The quick brown fox jumped over the lazy dog.', 'fox') engine.startLoop()

使用一個外部的驅動迴圈

1 2 3 4 5 6 engine = pyttsx.init() engine.say('The quick brown fox jumped over the lazy dog.', 'fox') engine.startLoop(False) # engine.iterate() must be called inside externalLoop() externalLoop() engine.endLoop()

總結

以上就是Python如何實現文字轉語音的全部內容，看完了上面的講述，是不是感覺Python實現文字轉語音還是蠻簡單的？那麼，大家快來嘗試嘗試吧。希望本文對大家學習Python有所幫助。

Python如何實現文字轉語音

Python如何實現文字轉語音

使用百度api實現文字轉語音功能

uniapp實現文字轉語音

python文字轉語音實現過程解析

python文字轉語音的例項程式碼分析

python 利用pyttsx3文字轉語音過程詳解

python3實現語音轉文字(語音識別)和文字轉語音(語音合成)

C#基於ClientWebSocket實現訊飛文字轉語音v2版本

python 實現dict轉json並儲存檔案

python實現文字版掃雷

python實現圖片轉素描效果程式碼

基於python實現圖片轉字元畫程式碼例項

文字轉語音-視訊配音軟體深度解析

基於python實現百度語音識別和圖靈對話

Python 實現圖片轉字元畫的示例(靜態圖片,gif皆可)

c++怎麼打印出句子中的各個單詞_知識詳解+Python實現|文字挖掘中的預處理方法...

文字轉語音或語音播報功能

python實現xml轉json檔案的示例程式碼

python實現excel轉html（合併單元格）

微軟開放其 “文字轉語音”AI 訪問許可權，華納兄弟用它做了個 “兔八哥”助手

Python如何實現文字轉語音

相關推薦