微軟 Azure AI 又一里程碑：Neural TTS 新模型呈現真人般情感飽滿的 AI 語音

阿新 • • 發佈：2022-01-27

1 月 27 日訊息，如何讓 AI 語音有效模仿人類對話的豐富動態與情感，已成為全球研究者的共同挑戰。據微軟官方訊息，就在不久前，微軟 Azure Neural TTS（神經網路文字轉語音）推出的新一代模型“Uni-TTS v4”在這一領域取得了里程碑式的重大突破。在“2021 國際語音合成大賽（Blizzard Challenge 2021）”的測試中，Uni-TTS v4 的語音表現與通用資料集上的自然語音相比幾乎沒有明顯差別，展現出足以“叫板”真人對話的實力。

“耳聽”為實，微軟官方還放出了幾段 TTS 和真人對話的對比，一起來感受下新模型帶來的逼真語音表現。

英語：The visualizations of the vocal quality continue in a quartet and octet.

真人錄音：

Uni-TTS v4：

英語：Like other visitors, he is a believer.

真人錄音：

Uni-TTS v4：

中文：另外，也要規避當前的地緣局勢風險，等待合適的時機介入。

真人錄音：

Uni-TTS v4：

使用者可以在 Azure TTS 線上服務中使用自創文字來建立新的 demo。目前 Uni-TTS v4 可支援 TTS 語言庫中 7 個語種的 8 個語音，研發團隊還將持續使用最新模型優化 Neural TTS 已支援的其它語言以及自定義神經語音，以便能讓使用者通過 Azure TTS API、 Microsoft Office 和 Edge browser 直接獲得更出色的新一代 TTS 語音。

官方介紹，為了讓 TTS 在以上兩方面獲得提升，Uni-TTS v4 在聲學建模中引入了兩項重要更新，研究團隊首先採用了一個帶有 transformer 和卷積塊的新架構，以更好地模擬聲學模型中的區域性和全域性依賴關係；其次，從顯性視角（身份 ID、語種 ID、音調、語速）和隱性視角（話語級和音素級韻律）系統地對變數資訊進行建模。這些視角分別使用監督學習和無監督學習，確保端到端的音訊具有足夠自然的表現力。

瞭解到，作為微軟 Azure 認知服務中的強大語音合成功能，Neural TTS 可用於幫助開發者將文字轉換為真人一般的逼真自然語音，常被用於語音助手場景、文字朗讀功能，及作為輔助性工具等等，同時也被整合到微軟的 Edge Read Aloud、Immersive Reader 和 Word Read Aloud 等旗艦產品中，還被 AT&T、Duolingo、Progressive 等眾多客戶採用。Neural TTS 已擁有 330 多個音色，支援來自不同國家和地區的近 130 種語言或方言。使用者和企業可以通過搜尋“Azure TTS”進入產品網站，測試體驗 Neural TTS 的豐富預設語音，抑或錄製並上傳自己的樣本，來建立獨有的自定義語音。

微軟 Azure AI 又一里程碑：Neural TTS 新模型呈現真人般情感飽滿的 AI 語音

微軟 Azure AI 又一里程碑：Neural TTS 新模型呈現真人般情感飽滿的 AI 語音

華為鴻蒙生態發展又一里程碑：HarmonyOS Connect 新增硬體合作伙伴 700+

又一里程碑：華為釋出礦山鴻蒙作業系統，HarmonyOS 在工業領域落地

又一里程碑：韋伯太空望遠鏡完成首次多儀器校準

谷歌創新過剩又一犧牲品：緊急定位應用Trusted Contacts將下架

又一款：華為 nova 8 Pro 4G 版上架官網，搭載麒麟 985

基建狂魔又一最：國內高鐵跨度最大、墩身最高 T 構橋主墩封頂

五菱巨集光又一對手：東風風光 MINIEV 官圖公佈，預計明年第一季度上市

五菱巨集光又一對手：東風風光 MINIEV 實尚款上市，2.86~4.16 萬元

空瓶一瓶又一瓶：米粹潔面泡泡 22.5 元/瓶（商超 49 元）

空瓶一瓶又一瓶：米粹泡泡潔面 22.5 元狂促（商超 49 元）

微軟承認更新又出 bug 了，Win10 新補丁修補效能問題失敗

微軟 Azure 又一漏洞被曝光：能訪問同一叢集客戶的資料，現已修復

又一模仿者入局：微軟 LinkedIn 開始測試與職業身份相關的音訊內容

Win11 又一鐵證！微軟 Windows 海報新發現：Logo 夾角 11°

又一重大里程碑：詹姆斯-韋伯太空望遠鏡完成鏡片對齊工作，還拍了張自拍

蘋果領導頁面又有變化：他已接過席勒全球營銷高階副總裁一職

《微軟飛行模擬》開發商 Asobo：正為微軟製作另一款遊戲

又一華為程式設計師進了ICU：壓垮一個家庭，一張結算單就夠

為AI注入一縷意識：構建更智慧、更強大的神經網路

微軟 Azure AI 又一里程碑：Neural TTS 新模型呈現真人般情感飽滿的 AI 語音

相關推薦