1. 程式人生 > 資訊 >微軟自定義神經語音技術已允許使用者建立高度逼真、類似於人類的聲音

微軟自定義神經語音技術已允許使用者建立高度逼真、類似於人類的聲音

3月4日訊息據微軟官方釋出,近期,Azure 認知服務中的語音服務的一部分——自定義神經語音 (Custom Neural Voice)——文字到語音功能已普遍推出。該功能將允許使用者使用微軟開創性的神經文字到語音模型,為應用建立高度逼真、類似人類的自定義語音。由於建立的語音非常逼真,微軟限制了訪問許可權,以便使用者負責任地使用這項技術。

微軟表示,

“作為微軟對負責任的人工智慧承諾的一部分,我們設計和釋出自定義神經語音的目的是保護個人和社會的權利,促進透明的人機互動,抵制有害的深層偽裝和誤導性內容的擴散。為此,我們對自定義神經語音的訪問和使用進行了限制。”

獲悉,要建立自定義語音,你只需錄製音訊並上傳作為訓練資料即可。Azure 語音服務將為你的錄音建立一個獨特的語音調整。自定義神經語音的聲音逼真自然,可以代表品牌,讓使用者以自然的方式與應用進行對話互動。

微軟強調,以下客戶已經在使用這項最新的 TTS 功能。

  • AT&T / 華納兄弟:他們最近在德克薩斯州達拉斯的 AT&T 體驗店推出了一個首創的創意和互動體驗,客戶可以直接與兔八哥對話。

  • Progressive:利用標誌性的 Progressive 保險發言人 Flo 的聲音,建立了 Flo 聊天機器人,以簡化客戶諮詢流程,提供個性化體驗。

  • Duolingo:為了讓學習一門新的語言感到可實現性和適用性,Duolingo 使用課程建立了多樣化的風格化聲音。