1. 程式人生 > 實用技巧 >AI可以複製任何人類聲音:這對播客意味著什麼?

AI可以複製任何人類聲音:這對播客意味著什麼?


全文共2032字,預計學習時長6分鐘

圖源:unsplash

播客正在向一種更加非正式的音訊敘述方式發展。缺少精心設計的語言,而是更多地強調了主持人和聽者之間的關係。主持人試圖運用語言,使每件事都更容易理解和反應。有聲故事的受歡迎程度呈上升趨勢,資料支援了這一說法。

據Statista統計,2018年,美國已經有7500萬播客聽眾,預計到2024年,每月聽眾人數將達到1.64億。2019年至2023年的複合年增長率估計為17%。

2020年,四分之三的美國人宣稱知道播客,其中超過一半(55%)的人已經聽過播客。世界上收入最高的播客是Joe Rogan的The Joe RoganExperience,在2019年賺了5000萬美元,每月有近2億的下載量。

播客行業目前面臨的主要問題是,如何在保持編輯獨立性的同時,收集必要的資源,支援如此快的增長,具有聲音克隆能力的人工智慧等突破性技術可能至少提供部分解決方案。

尼克松專案就是一個令人信服的案例,AI能夠以一種與複製與原聲沒有任何區別的人類聲音。麻省理工學院的一組研究人員、記者和藝術家與聲音克隆公司Respeecher和VDR公司Canny AI合作,創造了第一次月球探險的另一段歷史,宇航員尼爾·阿姆斯特朗和埃德溫·巴茲·奧爾德林未能完成任務,被困在月球上。

他們通過修改尼克松總統的真實視訊,製作了一個贗品,讓人們有可能聽到他告訴世界,登月之旅有一個悲慘的結局。

播客如何利用人工智慧

計算機化聲音的主要挑戰是複製人類聲音和情感上的細微差別,並避免機械音。在人工智慧技術的支援下,語音到語音的語音轉換技術為精確地實現這一目標提供了手段。

蘋果的Siri、亞馬遜的Alexa、微軟的Cortana或谷歌Assistant等虛擬助手仍在使用文字到語音的功能。雖然TTS仍然是一個非常有用的技術,要使一個聲音聽起來不同相當複雜。

例如讓Siri聽起來像一個年長的男人——它需要在預先錄製好的檔案之外,還要一個新的音訊檔案,裡面包含這段對話所有的單詞。讓我們來看看語音到語音轉換帶來的一些好處。

你如何使用人工智慧語音克隆播客?人工智慧使聲音克隆成為可能。它可以幫助你完美地複製任何播客專案的任何聲音。“智慧的雞尾酒”通常由兩種成分構成——經典數字訊號處理演算法和自營深生成建模技術,允許內容製作者使用最合適的聲音。

·邀請名人加入你的專案

演員、作家、運動員等越出名,請他們來播客節目就越困難。但如果你利用人工智慧來複制人類的聲音,你就不用再等極度繁忙的他們撥冗來到演播室了。你可以為觀眾提供他們最喜歡的聲音的錄音,還不用花太多的時間和金錢把他們帶到錄音棚。

·帶回過去的聲音

即使一位演員已經去世了,聲音克隆也能神奇地幫助你按照你的期望完成你的專案。你在做一個關於肯尼迪總統在去世前的歷史性播客嗎?語音轉換技術可以幫助你使用他的確切的聲音,而不是僅僅接近接近。

·使用孩子們的聲音

孩子們經常會說一些非常有趣的事情,並不一定是因為內容有趣,而只是因為他們說話的方式(音調、語調、口音等等)。同時,和他們一起工作也很有挑戰性。通過讓專業演員準確地按照孩子們說話的方式說出來,聲音合成可以簡化這個過程。

圖源:unsplash

·加速,直到完成你的播客專案

人工智慧可以在一瞬間複製人類的聲音。你所需要做的就是提供目標聲音的高質量錄音,用不了多久就成型了。

2017年,播客的廣告收入達到了2.2億美元,而且每年都在翻番。吸引潛在廣告客戶的主要因素是使用者參與度的提高,還有播客廣告能被聽到的事實,完成率高達90%左右。

此外,廣告商願意為某些播客時段支付高達30美元的cpm(每千次廣告的成本)。如果考慮到Facebook的平均cpm是6美元,這個數字就更合理了。

有線電視一步一個腳印地取代了網路電視,播客和廣播之間有著千絲萬縷的相似之處。即使我們把這個類比限制在電臺廣告預算上,這也意味著播客行業目前的財政狀況將得到200億美元的額外收益。正如我們一開始所說的,聽眾人數的增加證明了對利潤持續系統增長的預期是合理的。

圖源:unsplash

諸如此類的數字清楚地表明,播客將會繼續存在下去,我們迫切需要用更有效的方法來授權音訊內容製作者。上面列出的幾點只是AI能做到的事情的一小部分, AI語音克隆播客可以整個行業的發展,也能更好地處理編輯獨立性的問題。


推薦閱讀專題

留言點贊發個朋友圈

我們一起分享AI學習與發展的乾貨

編譯組:楊嫻、鄧逸瑤

相關連結:

https://dzone.com/articles/ai-can-replicate-any-human-voice-what-does-that-me-4

如轉載,請後臺留言,遵守轉載規範

推薦文章閱讀

ACL2018論文集50篇解讀

EMNLP2017論文集28篇論文解讀

2018年AI三大頂會中國學術成果全連結

ACL2017論文集:34篇解讀乾貨全在這裡

10篇AAAI2017經典論文回顧

長按識別二維碼可新增關注

讀芯君愛你