1. 程式人生 > >要想成為郎朗,請AI監督練琴可不行!

要想成為郎朗,請AI監督練琴可不行!

文 | 魏啟揚

來源 | 智慧相對論(ID:aixdlun)

 

在決定讓小孩學琴之前,老師就一再強調:“學琴是個長久的事情,三分學,七分練,課後的練習很重要!”

 

作為一個琴童的家長,督促孩子練琴是件頭疼的事情。請老師陪練,除了需要額外支出一筆課時費外,家與琴行之間的通勤還得預備大量時間;自己親自上,由於缺乏專業知識,無法解答孩子在練琴中出現的問題,至於錯音、手型、指法等孩子練琴時經常出現的錯誤,自然也是沒有能力糾正的了。

 

普通家長無法勝任琴童的陪練工作,那麼看上去“無所不能”的AI能行嗎?當越來越多的AI陪練產品的廣告以“無孔不入”的態勢對你進行衝擊時,你是否會有那麼一點點心動?

 

千億級市場催生多種玩家

 

在應試教育體系下,音樂教育受到的關注和重視程度遠遠不及那些文化科目,至於鋼琴、小提琴這些樂器的演奏更是小眾人的喜好,不然我們也不會用鄙夷的眼神看待朋友圈中晒音樂會門票的行為了——“裝什麼?誰知道那張票是地上撿的還是充值送的?”

 

圈層的小眾並不代表其中缺乏市場,相反,在音樂培訓行業,其中的市場規模出人意料的大。

 

根據中國樂器協會的統計資料顯示,2017年,中國樂器市場規模達448億元人民幣,佔據全球樂器市場三成左右,僅次於美國成為世界第二大樂器市場;與之相關的音樂教育培訓市場規模更大,超過樂器市場規模兩倍,接近1000億元人民幣。此外在音樂教育普及率方面,國內音樂教育的普及率只有2.5%,歐美國家的普及率在20%以上,這也給音樂教育培訓行業描繪了一幅巨大的藍圖。大量資本湧入賽道,音樂培訓的主課教學上傳統模式與線上平臺混戰廝殺,琴童的課後陪練也引發了大量玩家進場爭食。

 

對於陪練這種較為枯燥的重複性工作,家長不懂,一般的老師又不願意接(相比陪練課,主課課時費更高),於是AI陪練如同“救世主”般出現了,在這個賽道中,主要有三類玩家。

 

1、陪練機器人:直接以機器人的形式監督琴童練琴,隨時指正練習過程中的錯誤,為消除練琴時的枯燥感,機器人還可以與琴童交流互動。練琴結束後,機器人還可根據當天的練習情況生成一份練琴報告。這類機器人價格不貴,淘寶上的價位在千元左右。

 

2、AI+真人陪練:像“滴滴”打車一樣,使用者在平臺釋出陪練需求後,平臺專職的陪練老師就會接單,在線上通過視訊直播的方式進行陪練(也可指定陪練老師固定上課時間)。平臺會通過AI裝置採集琴童練琴時的各項資料並進行分析,陪練老師也會根據AI裝置採集回的音訊、視訊資料對使用者進行實時指導。目前這類玩家最受資本追捧,像VIP陪練、音樂筆記等AI+真人陪練平臺已經經歷多輪融資。

 

3、手機APP:最便捷的一種AI陪練方式。以生成練琴報告的形式對練琴效果進行分析和判斷。略微侷限的是,手機APP只能從聲音層面比如錯音、節奏等維度進行分析,練琴時的指法、手型等需要視覺層面進行判斷的維度尚無法分析。

 

AI陪練只能“遠觀”不可“細究”

 

在音樂陪練這個應用場景中,通過機器的感測器和演算法的接入來代替重複性勞動,包括一些基礎性的判斷和資料分析等,這正是AI所擅長的。

 

相比真人陪練需要通過耳朵和眼睛來收集演奏的聲音、節奏、指法等資訊(資料),通過AI來收集這些資料做判斷會比人類更加精準,並且還能大幅提高效率。在目前的實際應用中,AI陪練對於解決琴童練習過程中經常出現的音準、節奏、連貫性等問題做的還不錯,但AI陪練要想完全顛覆傳統陪練模式,還需跨越3個技術障礙。

 

1、準確的音訊識別能力

 

音準是否正確是陪練需要解決的核心問題之一,AI陪練基本都是用採集來的音訊資料與曲庫中的標準演奏音準進行比對,從而來判斷琴童彈奏的質量。從技術原理來看並不複雜,但在實際應用中,AI陪練的音訊識別準確性並不穩定。

 

“明明彈奏的很流暢,沒有問題,但陪練機器人還是在一旁提示錯音、漏音。”在調查過程中,智慧相對論收到的琴童吐槽不在少數。

 

雖然AI在語音識別方面取得了很大的進展,但在嘈雜環境下的語音識別,AI處理起來還是有些力不從心,特別是幾個人同時交流說話時,要想分辨出每個人的說話內容對於AI來說還是有些困難。麻省理工大學曾對樂曲的音訊識別做過研究,在錄音棚等音質極端乾淨的環境中,AI的複音(4個音同時演奏)識別準確率在94%,然而在普通環境中,AI的複音識別率最高只能達到74%,這樣的識別率還只是對鋼琴4級以下樂曲進行測試時獲得的。隨著樂曲難度的增加,AI陪練音準識別的準確率也隨之降低。

 

在音準識別這一項上,陪練機器人和真人陪練老師的優劣高下立判,至於手機APP,除了給它一個“呵呵”,無需再作太多評價。

 

2、演奏技巧的分析能力

 

音樂的美妙之處在於7個音符通過不同的排列組合方式形成的旋律所帶來的美感,不同樂器的聲音特性在表達特定情感時所產生的共鳴。根據樂器的演奏方式可分為以薩克斯、嗩吶為代表的吹管類;以小提琴、二胡為代表的拉弦類、以鋼琴、古箏為代表的彈撥類和以架子鼓、馬林巴為代表的打擊類。現在問題來了,樂器的種類五花八門,演奏技巧更是繁雜多變,對於不同樂器演奏技巧的分析,AI的表現並不會比不懂樂器的你我更好。

 

目前市場主流的AI陪練機器人只能對鋼琴、小提琴、手風琴、古箏4個樂器進行陪練,對於需要手腳協調配合演奏的架子鼓、雙排鍵、管風琴等樂器,AI尚不能很好的理解這些樂器的演奏技巧,特別在一些打擊樂需要用到的手腕“暗勁”上,AI難以捕捉到相關資料,即便通過可穿戴裝置記錄到相關資料,如何對資料建模,對這類技巧進行描述和講解,現在的AI可用的辦法不多。至於那些通過運氣技巧演奏的吹奏類樂器,從氣息的聚集,到發力方式和部位,再到吹氣、吐氣、換氣的節奏間隔,現有AI技術能夠介入的程度有限,能夠起到的陪練效果自然有限。

 

3、演奏水平的鑑賞能力

 

在藝術創作領域,AI已經進行了有益的嘗試,不光能寫劇本、小說,還能畫畫和作曲,特別是當首幅AI畫作拍出300萬的高價時,人類開始重新審視AI的“創造力”和藝術鑑賞能力。在陪練這個屬於藝術鑑賞範疇的領域,AI的鑑賞水平能達到怎樣的程度呢?

 

考量一首樂曲演奏完成程度的高低,往往涉及到多個維度。以鋼琴為例,需要從樂句、節奏、觸鍵準確性、雙手配合、指法、緊張程度、觸鍵力度、演奏法八個維度進行評判。不同維度應用場景的互動與疊加,讓AI對樂曲鑑賞標準的建模變得異常複雜。這個標準人類也只有一個大致框架,沒有形成讓AI更容易理解的量化資料。特別是AI的藝術創造力還未獲得人類普遍認可的情況下,在音樂鑑賞方面,如何將對音樂的鑑賞從表面的音準、節奏等音訊資料深入到樂曲的音響結構及各種形式因素上去,準確地把握音樂作品的“內涵”,真正地聽懂音樂,AI的“自我學習”還有一段很長的路要走。

 

AI+真人線上陪練並不是最優方案

 

如果說現有的技術水平還不支援AI完成陪練的所有流程和環節,那麼AI+真人的線上陪練模式是否就是當前音樂陪練領域的最佳解決方案呢?從當前AI+真人線上陪練所暴露出的問題來看,線上平臺要想顛覆傳統陪練模式道長且阻。

 

首先,價格時間等使用者痛點依然存在。

 

AI的出現就是為了解放生產力,讓人類以更小的代價(金錢)獲取收益,或者讓人類脫離低效重複勞動。AI+真人線上陪練平臺這兩方面都沒有很好的解決。

 

為了更好的陪練效果,真人陪練老師在這一模式是永遠無法繞開的一環,他們必須時刻線上對琴童的練習進行監督和指導。

 

在使用者端,選擇AI真人線上模式陪練也是希望在科技的推動下,能夠享受到更低的課時開銷,但在線上平臺的運營下,AI技術的加入反而成了高課時費的理由。目前主流AI真人線上陪練平臺的課時費普遍在100—200元間,這個標準幾乎與主課課時費相當,與傳統陪練模式課時費相比也無優勢。

 

其次,陪練老師與主課老師缺乏協同配合。

 

在AI+真人陪練平臺的教學流程中,很多陪練老師會在陪練學生的譜子上圈出一堆圈圈,然後批註下去練習時要改正。可實際情況是,這個學生已經上完了主課,在課堂上主課老師已經指出了他的不足,“主課時該圈的已經圈完了,陪練是要把圈圈一個一個去掉啊,哪怕一節陪練課去掉一個圈也好啊。”一位主課老師向智慧相對論吐槽線上陪練的問題時表示,自己不會向學生推薦AI+真人線上陪練平臺,如果學生真有需要,會線上下找對自己工作定位清楚的陪練老師。

 

主課線下老師上,陪練線上老師帶,兩個老師互不認識,毫無交集,又無順暢的溝通渠道,夾在中間的學生在不同教學思想老師的調擺下無所適從。

 

最後,網路環境極大影響陪練效果。

 

在5G即將到來的今天,我們所處的網路環境仍然不是非常穩定,特別是家中接入的終端裝置越來越多情況下,與朋友進行視訊通話、用平板網上追劇時常會出現卡頓、延遲的現象。

 

網路環境的不穩定也極大的影響著陪練的效果,往往就因為一點卡頓,AI裝置未能收錄到演奏的錯音,另一端的陪練老師自然也無法對演奏進行指正。出現這種問題的時候又該怪誰呢?

 

【完】

智慧相對論(微信id:aixdlun):深挖人工智慧這口井,評出鹹淡,講出黑白,道出vb深淺。重點關注領域:AI+醫療、機器人、智慧駕駛、AI+硬體、物聯網、AI+金融、AI+安全、AR/VR、開發者以及背後的晶片、演算法、人機互動等。