python之語音識別speech模組

阿新 • • 發佈：2020-09-10

1.原理

語音操控分為語音識別和語音朗讀兩部分。

這兩部分本來是需要自然語言處理技能相關知識以及一系列極其複雜的演算法才能搞定，可是這篇文章將會跳過此處，如果你只是對演算法和自然語言學感興趣的話，就只有請您移步了，下面沒有一個字會講述到這些內容。

早在上世紀90年代的時候，IBM就推出了一款極為強大的語音識別系統-vio voice,而其後相關產品層出不窮，不斷的進化和演變著。我們這裡將會使用SAPI實現語音模組。

2. 什麼是SAPI？

SAPI是微軟Speech API,是微軟公司推出的語音介面，而細心的人會發現從WINXP開始，系統上就已經有語音識別的功能了，可是用武之地相當之少，他並沒有給出一些人性化的自定義方案，僅有的語音操控命令顯得相當雞脅。那麼這篇文章的任務就是利用SAPI進行個性化的語音識別

程式碼

前提：開啟win7的語音自動識別（控制面板--輕鬆訪問--語音識別）

#!/usr/bin/env python
# -*- codinfg:utf-8 -*-
'''
@author: Jeff LEE
@file: .py
@time: 2018-07-19 11:15
@desc:
'''
from win32com.client import constants
import os
import win32com.client
import pythoncom
 
speaker = win32com.client.Dispatch("SAPI.SPVOICE")
 
 
class SpeechRecognition:
 def __init__(self,wordsToAdd):
 self.speaker = win32com.client.Dispatch("SAPI.SpVoice")
 self.listener = win32com.client.Dispatch("SAPI.SpSharedRecognizer")
 self.context = self.listener.CreateRecoContext()
 self.grammar = self.context.CreateGrammar()
 self.grammar.DictationSetState(0)
 self.wordsRule = self.grammar.Rules.Add("wordsRule",constants.SRATopLevel + constants.SRADynamic,0)
 self.wordsRule.Clear()
 [self.wordsRule.InitialState.AddWordTransition(None,word) for word in wordsToAdd]
 self.grammar.Rules.Commit()
 self.grammar.CmdSetRuleState("wordsRule",1)
 self.grammar.Rules.Commit()
 self.eventHandler = ContextEvents(self.context)
 self.say("Started successfully")
 def say(self,phrase):
 self.speaker.Speak(phrase)
 
class ContextEvents(win32com.client.getevents("SAPI.SpSharedRecoContext")):
 def OnRecognition(self,StreamNumber,StreamPosition,RecognitionType,Result):
 newResult = win32com.client.Dispatch(Result)
 print("你在說 ",newResult.PhraseInfo.GetText())
 speechstr=newResult.PhraseInfo.GetText()
 # 下面即為語音識別資訊對應,開啟響應操作
 if speechstr=="記事本":
  os.system('notepad') 
 elif speechstr=="寫字板":
  os.system('write')
 elif speechstr=="畫圖板":
  os.system('mspaint')
 else:
  pass
 
if __name__ == '__main__':
 
 speaker.Speak("語音識別開啟")
 wordsToAdd = ["記事本","寫字板","畫圖板",]
 speechReco = SpeechRecognition(wordsToAdd)
 while True:
 pythoncom.PumpWaitingMessages()

　　除錯遇到問題

python呼叫語音模組時，遇見TypeError:NoneTypetakesnoarguments這種錯誤型別該如何解決

報錯的原因是：不能呼叫語音開發包

解決方法：(如果你已經安裝了pyWin32，它也安裝了PythonWin)

1.在python35目錄中找到pythonwin資料夾下的pythonwin.exe

python之語音識別speech模組

2.雙擊Pythonwin執行，然後選擇工具tools/commakepyutility

python之語音識別speech模組

3.然後選擇MicrosoftSpeechObjectLibrary5.4，點選OK鍵

python之語音識別speech模組

4.執行結果如下，問題解決

python之語音識別speech模組

後記

推薦一個不錯的語音識別文件：https://www.jb51.net/article/195212.htm

到此這篇關於python之語音識別speech模組的文章就介紹到這了,更多相關python 語音識別內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

python之語音識別speech模組

1.原理語音操控分為語音識別和語音朗讀兩部分。這兩部分本來是需要自然語言處理技能相關知識以及一系列極其複雜的演算法才能搞定，可是這篇文章將會跳過此處，如果你只是對演算法和自然語言學感興趣的話，就只有請

Python實現語音識別和語音合成功能

聲音的本質是震動，震動的本質是位移關於時間的函式，波形檔案(.wav)中記錄了不同取樣時刻的位移。

14-Python之路---包和模組

模組的概念模組是 Python 程式架構的一個核心概念通常模組為一個檔案，直接使用import來匯入就好了。可以作為module的檔案型別有".py"、".pyo"、".pyc"、".pyd"、"

Python之mmap記憶體對映模組（大文字處理）

背景：通常在UNIX下面處理文字檔案的方法是sed、awk等shell命令，對於處理大檔案受CPU，IO等因素影響，對伺服器也有一定的壓力。關於sed的說明可以看瞭解sed的工作原理，本文將介紹通過python的mmap模組來實現對大檔

python之資料分析numpy模組

1 #Numpy陣列是一個多維陣列物件，稱為ndarry，其由兩部分組成 2 #實際的資料描述這些資料的元資料

各大廠的語音識別Speech To Text API使用體驗

最近發現有聲讀物能極大促進我的睡眠，但每個前面都有一段開場語，想把它剪掉，但是有多個開場語，所以就要用到語音識別判斷一下再剪。

詳解python之協程gevent模組

Gevent官網文件地址： [ http://www.gevent.org/contents.html ](http://www.gevent.org/contents.html)

python之pymysql模組簡單應用示例程式碼

眾所周知，想要在python程式中執行SQL語句需要使用第三方模組：pymysql。下面，我將為大家簡述一下pymysql第三方庫的安裝到使用的大體流程。

Python 中的 import 機制之實現遠端匯入模組

所謂的模組匯入（ import ），是指在一個模組中使用另一個模組的程式碼的操作，它有利於程式碼的複用。

基於python實現語音錄入識別程式碼例項

這篇文章主要介紹瞭如何通過python實現語音錄入識別,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

使用Python和百度語音識別生成視訊字幕的實現

從視訊中提取音訊安裝 moviepy pip install moviepy 相關程式碼： audio_file = work_path + \'\\\\out.wav\'

Python之第二十二天的努力--模組2，random模組

01 模組回顧 \'\'\' 自定義模組 \'\'\' age = 10 def f1(): print(\'hello\') # 測試函式，在開發階段，對模組中的功能進行測試

python圖片驗證碼識別最新模組muggle_ocr的示例程式碼

一.官方文件 https://pypi.org/project/muggle-ocr/ 二模組安裝 pip install muggle-ocr # 因模組過新，阿里/清華等第三方源可能尚未更新映象，因此手動指定使用境外源，為了提高依賴的安裝速度，可預先自行安裝依

Python之第二十八天的努力--collections模組

01 collections模組 namedtuple() 命名元組 # namedtuple() 命名元組 Rectangle = collections.namedtuple(\'Rectangle_class\',[\'length\',\'width\'])

Python之第三十三天的努力--re模組

re模組 re.findall()和re.search() import re ret = re.findall(\'\\d+\',\'18746asd8784sds\') print(ret)# [\'18746\', \'8784\']

python操作excel之xlrd、xlwt模組詳解

python操作excel主要用到xlrd和xlwt這兩個庫，即xlrd是讀excel，xlwt是寫excel的庫。可從這裡下載https://pypi.python.org/pypi。下面分別記錄python讀和寫excel.

Python之常用模組

Python之常用模組模組，用一砣程式碼實現了某個功能的程式碼集合。類似於函數語言程式設計和麵向過程程式設計，函數語言程式設計則完成一個功能，其他程式碼用來呼叫即可，提供了程式碼的重用性和程式碼間的耦合

python之random模組詳解

import random import string # 隨機整數： print random.randint(1,50) #左右都是閉區間 # 隨機選取0到100間的偶數：

python 之os模組用法大全

python 之os模組用法大全 Python的標準庫中的os模組包含普遍的作業系統功能。這個模組的作用主要是提供與平臺無關的功能。也就是說os模組能夠處理平臺間的差異問題，使得編寫好的程式無需做任何改動就能在另外的平

python之logging日誌模組

python之logging日誌模組 1.logging模組簡介用Python寫程式碼的時候，在想看的地方寫個print xx 就能在控制檯上顯示列印資訊，這樣子就能知道它是什麼了，但是當我需要看大量的地方或者在一個檔案中檢視的時候，這時

python之語音識別speech模組

相關推薦