乾貨 | 呼叫AI api 實現網頁文字朗讀

京東雲上提供了足夠多的人工智慧api，並且都使用了http的方式進行了封裝，使用者可以方便在自己的系統中接入京東雲的ai能力。今天就是介紹一下如何編寫很少的程式碼就能使用京東雲的語音合成api在網頁中實現文字朗讀，最終實現效果，延遲小，支援主流裝置，聲調優美，還能男女生切換。

最終效果

最終效果，微信開啟連結，點選播放按鈕則可以進行文字朗讀。

Api介紹

京東雲AI API使用Restful介面風格，同時提供了java和python的sdk，使用sdk能夠方便的封裝引數，呼叫api獲得資料。

為了提升呼叫方的響應速度，語音合成api採用了分段合成的模式，所以呼叫的時候在後端邏輯中按順序多次呼叫，將音訊資料以資料流的形式回寫給前端。

獲取AK/SK

訪問京東雲api需要獲取 ak sk ，配合sdk使用；
進入京東雲控制檯-賬號管理-Access Key管理，建立並獲取Access Key。

後端音訊流合成

這裡給出後端部分原始碼，實現一個controller，開發一個get請求方法，引數封裝的邏輯全都提煉出單獨的方法，程式碼邏輯結構簡單易懂。程式碼使用fastJson處理引數，另外引用了京東雲sdk，其餘都是jdk自帶的api，依賴很少。

  1 import com.alibaba.fastjson.JSON;
  2 import com.alibaba.fastjson.JSONObject;
  3 import com.wxapi.WxApiCall.WxApiCall;
  4 import com.wxapi.model.RequestModel;
  5
  6 import org.springframework.stereotype.Controller;
  7 import org.springframework.web.bind.annotation.GetMapping;
  8 import org.springframework.web.bind.annotation.RequestHeader;
  9
 10 import javax.servlet.http.HttpServletRequest;
 11 import javax.servlet.http.HttpServletResponse;
 12 import java.io.IOException;
 13 import java.io.OutputStream;
 14 import java.util.Base64;
 15 import java.util.HashMap;
 16 import java.util.Map;
 17
 18 @Controller
 19 public class TTSControllerExample {
 20    //url appkey secretkey
 21    private static final String url = "https://aiapi.jdcloud.com/jdai/tts";
 22    private static final String appKey = "";
 23    private static final String secretKey = "";
 24
 25    @GetMapping("/tts/stream/example")
 26    public void ttsStream(
 27            @RequestHeader(value = "Range", required = false) String range,
 28            HttpServletRequest req,
 29            HttpServletResponse resp) {
 30
 31        //應對safari的第一次確認請求攜帶header Range：bytes=0-1,此時回寫1byte資料，防止錯誤
 32        if ("bytes=0-1".equals(range)) {
 33            try {
 34                byte[] temp = new byte['a'];
 35                resp.setHeader("Content-Type", "audio/mp3");
 36                OutputStream out = resp.getOutputStream();
 37                out.write(temp);
 38 } catch (IOException e) {
 39                e.printStackTrace();
 40            }
 41            return;
 42        }
 43        //封裝輸入引數
 44        Map queryMap = processQueryParam(req);
 45        String text = req.getParameter("text");
 46 //封裝api呼叫請求報文
 47        RequestModel requestModel = getBaseRequestModel(queryMap, text);
 48        try {
 49 //回寫音訊資料給前端
 50            writeTtsStream(resp, requestModel);
 51 } catch (IOException e) {
 52            e.printStackTrace();
 53        }
 54    }
 55
 56    /**
 57     * 將前端輸入引數封裝為api呼叫的請求物件，同時設定url appkey secaretKey
 58     * @param queryMap
 59     * @param bodyStr
 60     * @return
 61     */
 62    private RequestModel getBaseRequestModel(Map queryMap, String bodyStr) {
 63        RequestModel requestModel = new RequestModel();
 64        requestModel.setGwUrl(url);
 65        requestModel.setAppkey(appKey);
 66        requestModel.setSecretKey(secretKey);
 67        requestModel.setQueryParams(queryMap);
 68        requestModel.setBodyStr(bodyStr);
 69        return requestModel;
 70    }
 71
 72    /**
 73     * 流式api呼叫，需要將sequenceId 依次遞增，用該方法進行設定請求物件sequenceId
 74     * @param sequenceId
 75     * @param requestModel
 76     * @return
 77     */
 78    private RequestModel changeSequenceId(int sequenceId, RequestModel requestModel) {
 79        requestModel.getQueryParams().put("Sequence-Id", sequenceId);
 80        return requestModel;
 81    }
 82
 83    /**
 84     * 將request中的請求引數封裝為api呼叫請求物件中的queryMap
 85     * @param req
 86     * @return
 87     */
 88    private Map processQueryParam(HttpServletRequest req) {
 89        String reqid = req.getParameter("reqid");
 90        int tim = Integer.parseInt(req.getParameter("tim"));
 91        String sp = req.getParameter("sp");
 92
 93        JSONObject parameters = new JSONObject(8);
 94        parameters.put("tim", tim);
 95        parameters.put("sr", 24000);
 96        parameters.put("sp", sp);
 97        parameters.put("vol", 2.0);
 98        parameters.put("tte", 0);
 99        parameters.put("aue", 3);
100
101        JSONObject property = new JSONObject(4);
102        property.put("platform", "Linux");
103        property.put("version", "1.0.0");
104        property.put("parameters", parameters);
105
106        Map<String, Object> queryMap = new HashMap<>();
107 //訪問引數
108        queryMap.put("Service-Type", "synthesis");
109        queryMap.put("Request-Id", reqid);
110        queryMap.put("Protocol", 1);
111        queryMap.put("Net-State", 1);
112        queryMap.put("Applicator", 1);
113        queryMap.put("Property", property.toJSONString());
114
115        return queryMap;
116    }
117
118    /**
119     * 迴圈呼叫api，將音訊資料回寫到response物件
120     * @param resp
121     * @param requestModel
122     * @throws IOException
123     */
124    public void writeTtsStream(HttpServletResponse resp, RequestModel requestModel) throws IOException {
125        //分段獲取音訊sequenceId從1遞增
126        int sequenceId = 1;
127        changeSequenceId(sequenceId, requestModel);
128        //設定返回報文頭內容型別為audio/mp3
129        resp.setHeader("Content-Type", "audio/mp3");
130        //api請求sdk物件
131        WxApiCall call = new WxApiCall();
132        //獲取輸出流用於輸出音訊流
133        OutputStream out = resp.getOutputStream();
134        call.setModel(requestModel);
135        //解析返回報文，獲得status
136        String response = call.request();
137        JSONObject jsonObject = JSON.parseObject(response);
138        JSONObject data = jsonObject.getJSONObject("result");
139        //第一次請求增加校驗，如果錯誤則向前端回寫500錯誤碼
140        if (data.getIntValue("status") != 0) {
141            resp.sendError(500, data.getString("message"));
142            return;
143        }
144        //推送實際音訊資料
145        String audio = data.getString("audio");
146        byte[] part = Base64.getDecoder().decode(audio);
147        out.write(part);
148        out.flush();
149        //判斷是否已結束，多次請求對應多個index，index<0 代表最後一個包
150        if (data.getIntValue("index") < 0) {
151            return;
152        }
153        //迴圈推送剩餘部分音訊
154        while (data.getIntValue("index") >= 0) {
155            //sequenceid 遞增
156            sequenceId = sequenceId + 1;
157            changeSequenceId(sequenceId, requestModel);
158            //請求api獲得新的音訊資料
159            call.setModel(requestModel);
160            response = call.request();
161            jsonObject = JSON.parseObject(response);
162            data = jsonObject.getJSONObject("result");
163            audio = data.getString("audio");
164            part = Base64.getDecoder().decode(audio);
165            //回寫新的音訊資料
166            out.write(part);
167            out.flush();
168        }
169    }
170
171
172
173 前端audio播放朗讀
174 前端部分給出在vue 模組化開發中的script部分，由於採用html5的audio進行語音播放，為了相容性需要引用howler.js (npm install howler)，主要邏輯為根據設定的引數和待朗讀的文字拼接一個url，呼叫howler.js 中的api進行播放。
175
176 <script>
177 import {Howl, Howler} from 'howler'
178 export default {
179  data() {
180    return {
181      news: { // 新聞內容
182        ……
183      },
184      role: 1, // 0女聲，1男聲
185      speed: 1, // 播放速度
186      curIndex: -1, // 播放的段落在所有段落中的順序，與使用者互動顯示相關，與流式播放無關
187      sound: null, // 頁面唯一的指向howler例項的變數
188      status: 'empty' // load,pause,stop,empty 僅與使用者互動顯示相關，與流式播放顯示無關
189    }
190  },
191  methods: {
192    generateUUID () { // 生成uuid
193      let d = Date.now()
194      return 'xxxxxxxx-xxxx-4xxx-yxxx-xxxxxxxxxxxx'.replace(/[xy]/g, c => {
195        let r = (d + Math.random() * 16) % 16 | 0
196        d = Math.floor(d / 16)
197        return (c === 'x' ? r : (r & 0x3) | 0x8).toString(16)
198      })
199    },
200    audioSrc (txt) { // 生成獲取音訊的連結
201      let content = encodeURI(txt) // 文字編碼
202      return `http://neuhubdemo.jd.com/api/tts/streamv2?reqid=${
203          this.generateUUID() // requestID
204        }&text=${
205          content // 編碼後的文字內容
206        }&tim=${
207          this.role // 男聲 or 女聲
208        }&sp=${
209          this.speed // 播放速度
210        }`
211    },
212    /** 
213     * 獲取文案對應的流式音訊
214     * 
215     * 使用howler能夠解決部分手機瀏覽器(eg:UC)的相容問題，
216     * 但解決ios上微信和safari的相容問題，
217     * 需要後端通過{range：bytes=0-1}這個header欄位對請求進行控制
218     *  @param {String 待轉音訊的文案} txt
219    */
220    howlerPlay(txt) { 
221      if (this.sound) {
222        this.sound.unload() // 若sound已有值，則銷燬原物件
223      }
224      let self = this
225      this.status = 'load'
226      this.sound = new Howl({
227        src: `${this.audioSrc(txt)}`,
228        html5: true, // 必須！A live stream can only be played through HTML5 Audio.
229        format: ['mp3', 'aac'],
230        // 以下onplay、onpause、onend均為控制顯示相關
231        onplay() {
232          self.status = 'pause'
233        },
234        onpause: function() {
235          self.status = 'stop'
236        },
237        onend: function() {
238          self.status = 'stop'
239        }
240      });
241      this.sound.play()
242    },
243    // 控制使用者互動
244    play (txt, index) {
245      if (this.curIndex === index) {
246        if (this.status === 'stop') {
247          this.sound.play()
248        } else {
249          this.sound.pause()
250        }
251      } else {
252        this.curIndex = index
253        this.howlerPlay(txt)
254      }
255    }
256  }
257 }
258 </script>

看完這個操作文件是不是躍躍欲試？對AI也想了解更多？

本週六我們為大家準備了【從“智慧零售”到“無人倉儲”，揭祕京東人工智慧技術的實踐與應用】“京東雲技術沙龍AI專場 ”！現場將會有技術專家為大家答疑解惑。

點選“閱讀原文”即可免費報名參加哦！

乾貨 | 呼叫AI api 實現網頁文字朗讀

京東雲上提供了足夠多的人工智慧api，並且都使用了http的方式進行了封裝，使用者可以方便在自己的系統

golang 呼叫win32 api 實現windows登出、重啟、關機

package main import ( "flag" "fmt" ) import ( . "github.com/CodyGuo/win" ) var ( arg string ) func init() { flag.StringVar(&arg, "uFlag

如何呼叫第三方API實現圖片上傳？

這裡是修真院後端小課堂，每篇分享文從【背景介紹】【知識剖析】【常見問題】【解決方案】【編碼實戰】【擴充套件思考】【更多討論】【參考文獻】八個方面深度解析後端知識/技能，本篇分享的是：【如何呼叫第三方API實現圖片上傳？】 1.背景介紹在

使用百度分享api實現網頁分享功能

百度官方文件：http://share.baidu.com/code/advance#toid 首先先引入外部檔案： with(document)0[(getElementsByTagName('head')[0]||body).appendChild(createElement('sc

python3 呼叫zabbix API實現批量增加刪除主機，主機各種監控項------實戰

在以前的部落格中談到了利用zabbix介面來對主機進行批量的增刪改查這裡在不用環境中實戰遇到了不同問題，這裡記錄下來以便後續review 以下為實戰中獲取token的程式碼，在zabbix標準介面文件中寫道 POST http://company.com/zabbix/api

用VB+API實現網頁下載和資料提交功能。

其實如果是單純的下載網頁，程式碼可以更簡單，但俺這段程式碼不僅可以下載WEB頁面，同時還可以向WEB頁傳遞引數，完全可以替換XMLHTTP的GET功能，俺本來還想加上POST功能的，後來專案中不需要，所以就沒加了，想了解WININET API的朋友，應該依此

如何使用 Python 實現網頁自動化朗讀？

作者 | hoxis責編 | 郭芮是不是有的時候懶得自己看新聞？那麼不妨試試用 Python 來

人臉識別（二）呼叫face++api實現人臉對比

上次部落格簡單講了一下呼叫face++的api來檢測人臉。當然，生產環境中要實現複雜的需求光靠這麼簡單的呼叫一下api肯定是不行的。這次先來講一講face++中實現人臉對比的api並實現一些相對較為複雜的需求。首先來看一看呼叫的人臉對比的api需要的東西:

Java呼叫百度API實現文字識別-羅紹崗-專題視訊課程

Java呼叫百度API實現文字識別—242人已學習課程介紹 java呼叫百度AI文字識別SDK來實現一張圖片的文字資訊課程收益

呼叫百度AI開放平臺實現圖片文字識別

閒話少說：註冊百度賬號，獲取APP_ID，API_KEY，SECRECT_KEY 檢視SDK，下面是我呼叫識別圖片 import os import csv from aip import AipO

呼叫科大訊飛API實現文字轉語音

#ifndef TRANSCODE_AUDIO_H #define TRANSCODE_AUDIO_H typedef void(*TranscodeCallbackFcn)(int, int, void*); extern int transcode_audio(const char *inAudio,

python，使用百度api實現復制截圖中的文字

content nsh AD con 讀取 __name__ return IT now() 百度雲文字識別技術文檔： https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E6.96.B0.E5.BB.BAAipOcr

js將字串作為函式名呼叫，實現input文字框等form表單元素回車鍵統一事件響應

通過給文字框<input enterKey=“fnName” />設定enterKey=“fnName”，頁面載入完後會自動繫結input的keydown事件，捕捉到回車鍵則呼叫fnName函式，如select等其它form元素也可以。要實現form表單元素回車鍵統一事件響應

Python——百度AI影象識別API實現動物識別

摘要：百度AI的文件中心是Python2寫的示例程式碼，我的是Python3，之間遇到一些問題，主要是字串的編碼問題，後面有總結。以下是修改之後的Python3 示例程式碼一、獲取access_token示例程式碼 import urllib.request # client_id

Java呼叫百度API實現翻譯-羅紹崗-專題視訊課程

Java呼叫百度API實現翻譯—390人已學習課程介紹 java呼叫百度API實現中英文翻譯課程收益此課程學習後可以反駁領悟

Java呼叫百度API實現翻譯

教程地址下面是Java呼叫百度API實現翻譯的具體步驟：一、在寫程式碼之前先在在百度翻譯平臺中，申請APP_ID 申請地址申請的詳見點選開啟連結申請之後，會得到APP_ID和SECURITY_KEY 二、java程式碼如

Java實現是否為節假日、工作日判斷（呼叫“http://api.goseek.cn/Tools/holiday”介面）

工具類： package com.ai.rai.group.system; import com.alibaba.fastjson.JSONObject; import com.alibaba.fastjson.TypeReference; import org.apache.common

【VBA研究】呼叫API實現漢字簡繁互換

iamlaosong文 Excel的VBA功能非常強大，但再強大的東西也需要藉助別的東西，API呼叫就可以完成很多VBA本身沒有的功能，一些已有的功能也是VBA呼叫API實現的。下面的漢字簡繁轉換程式碼，就是呼叫API完成的。關於API呼叫，網上有很多資料。學習程式設計首先是模仿，我在

android 呼叫百度翻譯API 實現線上翻譯

內容概要本篇文章為大家演示如何在微信公眾帳號上實現“智慧翻譯”，本例中翻譯功能是通過呼叫“百度翻譯API”實現的。智慧翻譯是指使用者任意輸入想要翻譯的內容（單詞或句子），系統能自動識別使用者採用的語言，並將其翻譯為其他語言，目前支援的翻譯方向：中->英、英->

呼叫微信介面實現網頁分享小功能

// 獲取access_token *注意* 經過實際開發測試，微信分享不支援跨域請求，因此獲取access_token的請求必須從伺服器發起，否則無法獲取到access_token所以以下都是服務端操作一、微信util類 public class Share

乾貨 | 呼叫AI api 實現網頁文字朗讀

最終效果

Api介紹

獲取AK/SK

後端音訊流合成

相關推薦