百度語音識別API的使用樣例（python實現）

阿新 • • 發佈：2018-12-30

百度給的樣例程式，不論C還是Java版，都分為method1和method2兩種

前者稱為隱式（post的是json串，音訊資料編碼到json裡），後者稱為顯式（post的就是音訊資料）

一開始考慮到python wave包處理的都是“字串”，擔心跟C語言的陣列不一致，所以選擇低效但保險的method1，

即先將音訊資料base64編碼，再加上取樣率、通道數等資訊彙集成dict，最後總體編碼成json串

結果老是報：

3300 輸入引數不正確

先後試過urllib2和pycurl包，都是上面情況

不得已換用method2，成功（看來wave包對音訊的儲存並不是“字串”）

#encoding=utf-8

import wave
import urllib, urllib2, pycurl
import base64
import json
## get access token by api key & secret key

def get_token():
    apiKey = "xxxxxxxx"
    secretKey = "xxxxxxxxx"

    auth_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=" + apiKey + "&client_secret=" + secretKey;

    res = urllib2.urlopen(auth_url)
    json_data = res.read()
    return json.loads(json_data)['access_token']

def dump_res(buf):
    print buf


## post audio to server
def use_cloud(token):
    fp = wave.open('vad_0.wav', 'rb')
    nf = fp.getnframes()
    f_len = nf * 2
    audio_data = fp.readframes(nf)

    cuid = "xxxxxxxxxx" #my xiaomi phone MAC
    srv_url = 'http://vop.baidu.com/server_api' + '?cuid=' + cuid + '&token=' + token
    http_header = [
        'Content-Type: audio/pcm; rate=8000',
        'Content-Length: %d' % f_len
    ]

    c = pycurl.Curl()
    c.setopt(pycurl.URL, str(srv_url)) #curl doesn't support unicode
    #c.setopt(c.RETURNTRANSFER, 1)
    c.setopt(c.HTTPHEADER, http_header)   #must be list, not dict
    c.setopt(c.POST, 1)
    c.setopt(c.CONNECTTIMEOUT, 30)
    c.setopt(c.TIMEOUT, 30)
    c.setopt(c.WRITEFUNCTION, dump_res)
    c.setopt(c.POSTFIELDS, audio_data)
    c.setopt(c.POSTFIELDSIZE, f_len)
    c.perform() #pycurl.perform() has no return val

if __name__ == "__main__":
    token = get_token()
    use_cloud(token)

執行結果

{"corpus_no":"6150045491002357923","err_msg":"success.","err_no":0,"result":["播放小蘋果，"],"sn":"243903724071431919050"}

百度語音識別API的使用樣例（python實現）

百度給的樣例程式，不論C還是Java版，都分為method1和method2兩種前者稱為隱式（post的是json串，音訊資料編碼到json裡），後者稱為顯式（post的就是音訊資料）一開始考慮到python wave包處理的都是“字串”，擔心跟C語言的陣列不一致，所

python呼叫百度語音識別 api

#!/usr/bin/env python # -*- coding: utf-8 -*- #####################################################

百度語音識別api呼叫 python

最近在處理語音檢索相關的事。其中用到語音識別，呼叫的是訊飛與百度的api，前者使用js是實現，後者用python3實現（因為自己使用python）環境： python3.5 centos 7 流程整個百度語音識別rest api 使用分

Android studio整合百度語音識別api

今天專案中要用到語音功能，所以看了下百度語音api 1，根據百度語音開發文件，建立應用，下載相應的jar包，新增到你的應用 2，清單檔案配置資訊，

python pyaudio 百度語音識別api 圖靈api 語音聊天機器人

最近有點頹，還是寫寫python緩解一下（不務正業x idea 之前看到有拆筆記本螢幕做魔鏡的覺得特別神奇，當時記得是要樹莓派來著。現在自己搞搞發現百度的語音識別api還不錯，加上以前註冊的圖靈ai大概也能搞個語音聊天機器人，主要還是筆記本上終於帶了一個

Web API學習筆記（Python實現）

參考指南： Web API入門指南 http://www.cnblogs.com/guyun/p/4589115.html 用Python寫一個簡單的Web框架 http://www.cnblogs.com/russellluo/p/3338616.html W

百度語音識別REST API使用方法（含C++程式碼）——不需要整合SDK的方法

本文程式碼為C++版，可以用於C環境的應用開發中，下面介紹其中重要的程式碼。下面程式碼是一個可以使用該方式進行語音識別功能的例項程式碼 #include <stdio.h> #include <stdlib.h> #include "curl

Qt：使用百度語音識別REST API，做全平臺語音識別

百度語音開發介紹文件：使用語音識別，需要在百度申請一個應用，然後拿到API Key和Secret Key，然後才可以使用語音識別 ps：我的示例裡面有放了一組可用的Key，但是僅供各位測試使用，有需要開發App的請自行申請，放在示例中的Key我可能隨時會撤銷。 ps：

Unity整合百度語音識別和合成--REST API

直接上unity的C#指令碼程式碼百度語音識別 using System.Collections; using System.Collections.Generic; using UnityEngine; using System.Xml; using

hbase java api樣例（版本1.3.1，新API）

quorum desc color -i arraylist byte logs sin fig 驗證了如下幾種java api的使用方法。 1.創建表 2.創建表（預分區） 3.單條插入 4.批量插入 5.批量插入（寫緩存） 6.單條get 7.批量get 8.簡單sca

python 與百度人臉識別api

ace tps get 格式 {} 之前 _id urllib 檢測用python來做人臉識別代碼量少思路清晰，在使用之前我們需要在我們的配置的編譯器中通過pip install baidu-aip 即可 from aip import AipFace

Python3-呼叫百度語音REST API

轉自：https://blog.csdn.net/wolfblood_zzx/article/details/46418635 （百度的rest介面的部分網址發生了一定的變化，相關程式碼已更新）百度通過 REST API 的方式給開發者提供一個通用的 HTTP 介面，基於該介面，開

MUI框架-11-MUI前端 + 後臺接入百度文字識別API

MUI框架-11-MUI前端 +php後臺接入百度文字識別API 這裡後臺不止一種，Python，Java，PHP，Node，C++，C# 都可以這裡使用的是 php 來介紹，已經解決所有問題，因為處理很多錯誤，可能會比較複雜，請大家堅持按步驟來，大概流程

Python 利用百度文字識別 API 識別並提取圖片中文字

Python 利用百度文字識別 API 識別並提取圖片中文字利用百度 AI 開發平臺的 OCR 文字識別 API 識別並提取圖片中的文字。首先需註冊獲取 API 呼叫的 ID 和 key，步驟如下：開啟百度AI開放平臺，進入控制檯中的文字識別應用(需要有百度賬號）。

百度語音識別--示例

終於找到能跑通的，copy下~~import requests import json import os import base64 #設定應用資訊 baidu_server = "https://openapi.baidu.com/oauth/2.0/token?"

node百度語音識別

絕對乾貨，直接程式碼詳解 1. 擷取一段音訊檔案（wav） eg:audio.wav 2. 驗證語音識別賬戶 var config_data= { apiKey: "4eymBfpmT4Laaaaaaaa", secretKey: "da

mui 百度語音識別轉換文字

前言　　用mui混合開發的APP，現有一個功能需求就是語音轉換成文字，並把語音進行儲存。對此考慮兩種選擇訊飛和百度。最終選擇了百度語音。百度語音　　通過官方文件我們大致可以確定如果想要實現語音識別，要做到以下幾點： 1.獲取Access Token 2.獲取錄音 REST

trackingjs+websocket+百度人臉識別API，實現人臉簽到

在公司做了個年會的簽到、抽獎系統。用java web做的，用公司的辦公app掃二維碼碼即可簽到，掃完碼就在大螢幕上顯示這個人的照片。之後領導讓我改得高大上一點，用人臉識別來簽到，就把掃二維碼的步驟改成人臉識別。瞭解了相關技術後，大致思路如下：先用websocket與後臺建立通

在Android Studio下使用百度語音識別的一個簡單例子

一、引言利用百度語音識別和百度語音合成可以很方便的設計一個語音互動應用，這裡記錄一下百度線上語音識別的簡單例子以便快速上手。我所用的語音識別包的版本是Baidu-Voice-SDK-Android-1.6.2.zip，開發平臺用的是Android Studio

javaMP3轉pcm 百度語音識別

不多說直接貼程式碼import com.baidu.aip.speech.AipSpeech; import javazoom.spi.mpeg.sampled.file.MpegAudioFileReader; import org.json.JSONObject; imp

百度語音識別API的使用樣例（python實現）

相關推薦