1. 程式人生 > 資訊 >愛奇藝發起首個基於劇本的角色情感識別挑戰賽:愛、樂、驚、怒、恐、哀

愛奇藝發起首個基於劇本的角色情感識別挑戰賽:愛、樂、驚、怒、恐、哀

9 月 23 日訊息 近期,CCF 大資料與計算智慧大賽第九屆正式啟動,愛奇藝攜手中國計算機學會,發起劇本角色情感識別挑戰,誠邀全球英才組隊參與,探討技術難題和行業痛點,這也是業內首個基於劇本的角色情感識別挑戰賽。

獲悉,基於劇本的角色情感識別主要是依託劇本中每句對白和動作描述,對相關角色進行多維度分析,並識別出情感。相對於常見的新聞、評論性文字的情感分析,有其獨有的業務特點和挑戰。

本賽題也基於愛奇藝業務場景提出,需要參賽者利用自然語言處理和相關的技術手段,來對劇本中存在的多種情感元素進行綜合判斷和識別。

劇本所富含的情感是劇本的靈魂,一個好的劇本總包含著充分的情感釋放,情感分析正是劇本評估中非常有意義的一個方面。

賽題概覽

愛奇藝為本次挑戰賽準備了一部分劇本場景作為訓練集,訓練集資料已由人工進行標註,參賽隊伍需要對劇本場景中每句對白和動作描述中涉及到的每個角色的情感從多個維度進行分析和識別。

本賽題的情感定義共 6 類(按順序):愛、樂、驚、怒、恐、哀;選手可以根據上述 6 類情感按固定順序對應的情感值,情感值範圍是 [0, 1, 2, 3],0-沒有,1-弱,2-中,3-強,以英文半形逗號分隔;本賽題演算法評分將採用常用的均方根誤差(RMSE)來計算評分,按照“文字內容 + 角色名”識別出的 6 類情感對應的情感值來統計。

和其他類文體相比,劇本類文字行文風格和通常的新聞類語料差別較大,更加口語化,同時,劇本場景中的對白和動作描述都涉及到角色的情感,而且要從 6 個維度進行識別,難度也更高;再加上劇本中角色情感不僅僅取決於當前的文字,對前文語義可能有深度依賴,很容易出現識別錯誤。

賽題賽程

CCF 大資料與計算智慧賽(CCF Big Data & Computing Intelligence Contest,簡稱 CCF BDCI)由中國計算機學會於 2013 年創辦,是大資料與人工智慧領域的演算法、應用和系統大型挑戰賽事。本次 2021 年 CCF BDCI 第九屆大賽以“數引創新,競促匯智”為主題,立足餘杭、面向全球,歡迎各路精英選手前來參賽。