1. 程式人生 > >Yobe推出AI系統,分離人群中的語音,錯誤率降低85%

Yobe推出AI系統,分離人群中的語音,錯誤率降低85%

Yobe推出AI系統,分離人群中的語音,錯誤率降低85%

現在智慧助手和支援語音的揚聲器比以往更受歡迎。據Voicebot稱,約有4730萬美國成年人使用智慧音箱,超過一半的智慧手機使用者(52%)表示他們在移動裝置上使用語音助手。但普及並不一定轉化為準確性。但從人群中隔離語音時,它們往往效果很差。

總部位於馬薩諸塞州波士頓的Yobe聲稱它可以讓智慧助手們成為更好的聽眾。該創業公司成立於麻省理工學院,並從Clique Capital Partners和國家科學基金會SBIR撥款籌集了近200萬美元的種子資金,Sutton與麻省理工學院博士和人工智慧輔助訊號處理研究員S. Hamid Nawab博士一起創立了Yobe。

Yorb推出了用於使用者檔案檢索的語音識別系統(VISPR),這是一種能在嘈雜環境中識別、跟蹤和分離聲音的智慧裝置。它聲稱AI允許它的軟體棧在任何聽覺環境中精確跟蹤聲音。

Yobe表示,通過VISRP,智慧手錶,助聽器和智慧家用電器等麥克風運動裝置可以識別只有喚醒詞的語音,並可以執行遠場語音個性化。它還聲稱VISPR可以減少高達85%語音識別錯誤。

“我們的技術正在解決當今市場中語音技術最持久的挑戰,”Yobe執行長兼聯合創始人Ken Sutton表示,“智慧手機,揚聲器和其他連線裝置在提供卓越的語音使用者介面方面受到限制。”

VISPR對雞尾酒會問題採取多管齊下的方法。其AI模型通過聲音和環境噪聲的相互作用積極推理,而其訊號處理流水線適應“場景特徵”的變化,即房間的聲學,揚聲器的數量和整體噪聲水平。同一管道採用複雜的時間,頻譜和統計技術來解析輸入的音訊訊號,並推廣不同的麥克風陣列大小和配置(並非所有支援語音的裝置都是一致的,例如,與Google Home Mini 2相比,亞馬遜的Echo Dot有7個麥克風)。

用簡單的英語,VISRP記錄聲音並將其放大,使用AI對其進行去噪並隔離單個聲音,並聆聽每個人獨有的告密生物識別識別符號。它類似於谷歌的語音匹配和亞馬遜的Alexa語音配置檔案,它可以檢索使用者配置檔案和與揚聲器相關的許可權,但Yobe聲稱其解決方案更加強大。

原文連結:Yobe推出AI系統,分離人群中的語音,錯誤率降低85%

本文為ATYUN(www.atyun.com)編譯作品,ATYUN專注人工智慧

請掃碼或微信搜尋ATYUN訂閱號及時獲取最新內容