Python 文字轉語音

阿新 • • 發佈：2019-02-05

文字轉語音，一般會用在無障礙開發。下面介紹如何使用Python實現將文字檔案轉換成語音輸出。

準備

我測試使用的Python版本為2.7.10，如果你的版本是Python3.5的話，這裡就不太適合了。
在windows上進行測試的話，這裡有兩種可選的方式：

pyttsx ：下載地址
微軟的Speech API ：這個需要安裝pywin32，下載地址

使用Speech API

原理

我們的想法是藉助微軟的語音介面，所以我們肯定是要進行呼叫相關的介面。所以我們需要安裝pywin32來幫助我們完成這一個底層的互動。

示例程式碼

import win32com.client 

speaker = win32com.client.Dispatch("SAPI.SpVoice")
speaker.Speak("Hello, it works!")

小總結

是的，呼叫介面來實現語音功能就是這麼簡單，但是我們不得不來聊一聊這種方式的缺點。

對中文支援的不夠好，僅僅是這一點，估計在中國沒幾個用它的了。
還有就是語速不能很好的控制，詳細的API介紹可以參照這裡API參考

pyttsx方式

原理

pyttsx 是Python的一個關於文字轉語音方面的很不錯的庫。我們還可以藉助pyttsx來實現線上朗讀rfc檔案或者本地檔案等等，最為關鍵的是，它對中文支援的還是不錯的。

示例程式碼

# coding:utf-8
import sys

reload(sys)
sys.setdefaultencoding('utf8')
#    __author__ = '郭 璞'
#    __date__ = '2016/8/6'
#    __Desc__ = 文字轉語音輸出

import pyttsx
engine = pyttsx.init()
engine.say('hello world')
engine.say('你好，郭璞')
engine.runAndWait()
# 朗讀一次
engine.endLoop()

小總結

使用pyttsx，我們可以藉助其強大的API來實現我們基本的業務需求。很酷吧。

pyttsx深入研究

做完上面的小實驗，你肯定會覺得怎麼這麼不過癮呢？
別擔心，下面我們就一起走進pyttsx的世界，深入的研究一下其工作原理吧。

語音引擎工廠

類似於設計模式中的“工廠模式”，pyttsx通過初始化來獲取語音引擎。當我們第一次呼叫init操作的時候，會返回一個pyttsx的engine物件，再次呼叫的時候，如果存在engine物件例項，就會使用現有的，否則再重新建立一個。

pyttsx.init([driverName : string, debug : bool]) → pyttsx.Engine

從方法宣告上來看，第一個引數指定的是語音驅動的名稱，這個在底層適合作業系統密切相關的。如下：

drivename：由pyttsx.driver模組根據作業系統型別來呼叫，預設使用當前作業系統可以使用的最好的驅動
- sapi5 - SAPI5 on Windows
- nsss - NSSpeechSynthesizer on Mac OS X
- espeak - eSpeak on every other platform
debug: 這第二個引數是指定要不要以除錯狀態輸出，建議開發階段設定為True

引擎介面

要想很好的運用一個庫，不瞭解其API是不行的。下面來看看pyttsx。engine.Engine的引擎API。

方法簽名	引數列表	返回值	簡單釋義
connect(topic : string, cb : callable)	topic：要描述的事件名稱；cb:回撥函式	→ dict	在給定的topic上添加回調通知
disconnect(token : dict)	token:回撥失聯的返回標記	Void	結束連線
endLoop()	None	→ None	簡單來說就是結束事件迴圈
getProperty(name : string)	name有這些列舉值“rate, vioce,vioces,volumn	→ object	獲取當前引擎例項的屬性值
setProperty(name : string)	name有這些列舉值“rate, vioce,vioces,volumn	→ object	設定當前引擎例項的屬性值
say(text : unicode, name : string)	text:要進行朗讀的文字資料; name：關聯發音人，一般用不到	→ None	預設要朗讀的文字資料，這也是“萬事俱備，只欠東風”中的“萬事俱備”
runAndWait()	None	→ None	這個方法就是“東風”了。當事件佇列中事件全部清空的時候返回
startLoop([useDriverLoop : bool])	useDriverLoop:是否啟用驅動迴圈	→ None	開啟事件佇列

元資料音調

在pyttsx.voice.Voice中，處理合成器的發音。

age
發音人的年齡，預設為None
gender
以字串為型別的發音人性別: male, female, or neutral.預設為None
id
關於Voice的字串確認資訊. 通過 pyttsx.engine.Engine.setPropertyValue()來設定活動發音簽名. 這個屬性總是被定義。
languages
發音支援的語言列表，如果沒有，則為一個空的列表。
name
發音人名稱，預設為None.

總結

看完了上面的講述，是不是感覺Python實現文字轉語音還是蠻簡單的？

那麼，快來嘗試嘗試吧。

Python 文字轉語音

文字轉語音，一般會用在無障礙開發。下面介紹如何使用Python實現將文字檔案轉換成語音輸出。準備我測試使用的Python版本為2.7.10，如果你的版本是Python3.5的話，這裡就不太適合了。在windows上進行測試的話，這裡有兩

使用Python實現文字轉語音並生成wav檔案

目前手邊的一些工作，需要實現聲音播放功能，而且僅支援wav聲音格式。現在，一些網站上支援文字轉語音功能，但是生成的都是MP3檔案，這樣還需要額外的軟體來轉成wav檔案，十分麻煩。後來，研究Python，發現Python可以很容易的實現上面的功能。步驟如下， 1。使用百度語音實現

Python實現文字轉語音功能

這是一篇簡單的Python文字（漢字）轉語音教程，當然對於其他語言工具在實現的方法上也是一樣的

C++ Builder 源碼：TTS 文字轉語音，可以朗讀文字，或者把文字轉為 wav 聲音文件

源碼 img 操作 sde lan 語音 skill http sta TTSDemo / TVictorTTS: 兼容 C++ Builder 2010 ~ C++ Builder 10 (CX) 版本 ? 包括 Win32 和 Win64 兩個版本。兼容的操作系統：W

web端文字轉語音的幾種方案

網站文字轉語音 rate str source req 實現 mes contex 最近在開發一個微信排隊取號的的系統，其中對於服務員端（管理端）需要有呼叫功能，即點按鈕就播出"xxx號顧客請就座"的聲音。經過在網上一番搜索研究，web端實現指定文字的語音播放方案

ios原生文字轉語音

link inf oid uic 是我代理方法聲音錄制初始 https 因新項目需求，需要接入類似支付寶收款提示聲----“支付寶到賬xxxx元”，就查看了一些文章，蘋果還是想的很周全，廢話不多說。首先在General -> Linked Framewor

Android文字轉語音引擎（TTS）使用

ner amp ucc count google 簡單 com 播報 androi 百度網盤下載地址密碼：3si0 簡單比較（應用包名） * com.svox.pico 系統自帶不支持中文語音 * com.svox.classic 搜svox

C#文字轉語音以及語音閱讀小例項

轉載自：猿哥愛碼 c#實現語音閱讀以及文字轉語音檔案是基於c#的一個類庫（SpeechSynthesizer ）實現的，使用該類必須要新增引用using System.Speech.Synthesis;直接是無法新增引用的，先對專案進行新增應用示例圖 using System;

Android Studio 接入訊飛語音合成（文字轉語音）

1.下載相應的SDK（參考我上一篇文章：https://mp.csdn.net/postedit/83743563） 2.佈置資源 . 3.新增許可權：在Application的根目錄下，為了可以訪問手機的一些功能

蘋果原生文字轉語音播報

Microsoft Azure——文字轉語音(TTS) REST API 使用教程

最近的工作需要用到文字轉語音（Text-to-Speech, TTS），故簡單地研究了現有的技術，在此與大家分享。 Azure上，語音部分的文件寫的較為詳細，包含各種功能，如TTS API，TTS SDK，自定義語音模型進行文字轉語音等。但是沒有整體的、提綱挈領般的介紹

Android百度語音整合——文字轉語音

專案涉及文字轉語音的需求，用Android原生提供的TTS生成的語音太單調，機器聲音太明顯，故尋求第三方更好的支援，用科大訊飛的語音包收費，百度語音免費而且不限制呼叫次數，主頁鮮明說永久免費的智慧語音開放平臺，故使用百度語音來支援。 &nbs

修改Setting中文字轉語音選項的首選引擎預設項

進入framework/base/core/java/android/speech/tts/TextToSpeech.java這個檔案，發現有個引數 puclic static final String DEFAULT_ENGINE = “com.svox.p

迅捷語音雲服務線上文字轉語音的方法

當我們在工作中，我們會用到不同的文字形式，我們需要這些文字轉換成語音的形式，下面就讓小編給大家介紹一下。步驟一：然後通過搜尋迅捷語音雲服務，我們可以直接進入到線上轉換中，找到文字轉語音；步驟二：然後進行檔案的輸出格式、音色型別等設定好；步驟三：等自定義完成之後就可以進行文字的輸入，將文字輸入到矩形框中；

迅捷語音雲服務在線文字轉語音的方法

ice 當我 text2 方法服務 href 文字點擊 water 當我們在工作中，我們會用到不同的文字形式，我們需要這些文字轉換成語音的形式，下面就讓小編給大家介紹一下。步驟一：然後通過搜索迅捷語音雲服務，我們可以直接進入到在線轉換中，找到文字轉語音；步驟二：然後進

呼叫GOOGLE的TTS實現文字轉語音(XE7+小米2)(XE10.1+小米5)

相關資料：注意：在手機上必須選安裝文字轉語音引擎“google Text To Speech”地址：http://www.shouji56.com/soft/GoogleWenZiZhuanYuYinYinQingGoogleTexttoSpeech_3864/ 結果總結

AWS機器學習初探（2）：文字翻譯Translate、文字轉語音Polly、語音轉文字Transcribe

這幾個服務的功能和使用都很直接和簡單，因此放在一篇文章中介紹。 1. 文字翻譯服務 Translate 1.1 功能介紹 AWS Translate 服務是一種AWS 機器學習應用服務，它利用高階機器學習技術來進行文字翻譯。它的使用非常簡單，只需要提供輸入文字，該服務就給出輸出文字。輸入

文字轉語音免費匯出，語音來至訊飛

轉自:http://www.krislq.com/2014/02/voicecloud_local/ 訊飛大家一定都非常的熟悉。最近需要把做個小功能來把文字轉換成語音，所以網上搜索了下，剛好訊飛在android端做了更新，可以儲存語音到本地啦。果斷下載來試了下。效果不錯

科大訊飛文字轉語音功能

首先，操作思路： 1.下載科大訊飛的msg.jar,.so.兩個檔案。 2.如何使用jar包中的內容： private static String TAG = "TtsDemo"; // 語音合成物件 private SpeechSynthesizer mT

呼叫科大訊飛API實現文字轉語音

#ifndef TRANSCODE_AUDIO_H #define TRANSCODE_AUDIO_H typedef void(*TranscodeCallbackFcn)(int, int, void*); extern int transcode_audio(const char *inAudio,

Python 文字轉語音

準備

使用Speech API

原理

示例程式碼

小總結

pyttsx方式

原理

示例程式碼

小總結

pyttsx深入研究

語音引擎工廠

引擎介面

元資料音調

更多測試

朗讀文字

事件監聽

打斷髮音

更換髮音人聲音

語速控制

音量控制

執行一個事件驅動迴圈

使用一個外部的驅動迴圈

總結

相關推薦