微軟研究院主管:我們決定讓AI理解幽默
幽默是人類獨有的特質,在日常生活中扮演著至關重要的作用。心理學家指出幽默在人類認知中發揮重要作用,包括它與學習、解決問題過程的驚人聯絡,以及幽默在社會參與中的重要性(Martin 2010)。幽默是智慧及其自動化研究中的一個頗有前景的領域:我們難以想象一臺計算機可以通過圖靈測試,卻無法理解和產生幽默。
隨著計算機越來越多地接手對話任務(如聊天機器人和個人助手),與使用者進行自然互動的能力變得越發重要,但自然的人機互動必須在在人類可以幽默——同時也能被計算機理解的情況下才算形成。最近的研究表明,AI 系統對於嘲弄的誤解可能是開放互動失敗的根源(Andrist et al. 2016)。
幽默與人類的關係如何?解釋這種現象一直是很多最偉大的思想家面臨的挑戰,研究幽默已是 20 多個學科的研究主題了(Raskin 2008),其中也包括電腦科學(Binsted et al. 2006),研究人員已經開發了用於檢測、分析和生成幽默語句的演算法。
幽默的自動分析頗為複雜,因為大多數幽默文字具有難以理清的複雜敘事結構;例如,典型的笑話——文獻中研究最多的幽默文字型別,小心地「佈置舞臺」,給觀眾建立某些期望,然後抖包袱顛倒期望(如,你以為有錢人像你想象的一樣快樂嗎?你錯了!有錢人的快樂你想象不到!)。為了規避敘事結構帶來的困難,本研究選擇了一種特定的幽默體裁:諷刺新聞。諷刺性新聞表面上模仿了主流新聞的典型形式,但與嚴肅性新聞不同,它的目的不在於關聯事實,而是嘲笑個體、群體或社會。而且更重要的是,諷刺性新聞往往首先從標題體現出來:只有標題本身有趣,故事的其餘部分才會徐徐展開(Glass 2008)。這明顯不同於真實的新聞報道,這也意味著諷刺性新聞的標題可以與正文分開研究,而標題的表達形式簡潔,敘事結構最少。
諷刺標題的另外一個優勢是它們模仿了嚴肅性新聞標題的公式化風格,這限制了它們的句法可變性,使我們能夠更好地控制句法,並將重點放在語義上。此外,諷刺標題不僅在風格上與嚴肅性新聞標題類似,內容上也有相似之處:僅僅改變一個詞就足以讓一個諷刺標題聽起來像嚴肅新聞。
執行示例。例如,將諷刺標題 God diagnosed with bipolar disorder(上帝被診斷患有躁鬱症)改成 Bob Dylan diagnosed with bipolar disorder(Bob Dylan 被診斷患有躁鬱症),那麼原本應該出現在洋蔥新聞上的文章就可以出現在嚴肅報刊上了。
此類諷刺標題與對應的嚴肅標題對組成的大型語料庫將為幽默研究開啟新的可能性。例如,我們可以通過檢視造成這對標題屬性不同(嚴肅 vs 幽默)的具體單詞,來更加細粒度地理解諷刺性文字的幽默之處。這是與之前研究的最大不同,之前的研究通常將平均諷刺標題與平均嚴肅標題進行對比 (Mihalcea and Pulman 2007)。此外,儘管本研究的主要目標是獲取對幽默的新見解,但是研究者還設想了一些新應用。例如,如果我們準確把握諷刺標題與嚴肅標題之間的區別,那麼我們或許可以建立一個流程,用少許的改動將真實的新聞標題改成諷刺性標題。
要想建立對齊資料庫,我們的第一個想法是將諷刺性新聞標題與嚴肅性新聞標題自動配對:從諷刺標題開始,找到幾乎同時間寫成的最類似的嚴肅標題。很難想象這個流程能獲得很多具備高度詞彙和句法相似度的標題對。另一個思路是眾包:向眾包人員展示嚴肅的標題,然後讓他們通過微小改動將其改成諷刺標題。不過,該任務需要創新性思維,這並非人人擁有。即使是美國最著名的諷刺報刊《洋蔥新聞》,每週生成的 600 個標題中也只有 16 個(小於 3%)被接受 (Glass 2008)。
一個關鍵的觀察結果是如果把這個任務反過來會簡單很多:只需微小改動即可直接去除諷刺標題中的幽默感,將標題變成看起來比較嚴肅的句子。也就是說,將別人費心寫就的幽默標題轉換成嚴肅版本所需的創造力遠遠少於向標題中新增幽默感。因此研究者採用了反向眾包方法,設計了一個遊戲 Unfun.me,如圖 1 所示。該遊戲給出諷刺性新聞標題 h,要求遊戲玩家 A 修改標題,讓其他選手認為修改結果 h' 是真實的嚴肅新聞標題。如果其他選手判斷修改結果 h' 是嚴肅標題,則玩家 A 得到的獎勵 R_A(h,h') 將上升,反之則獎勵下降。
圖 1. Unfun.me,用於構建諷刺-嚴肅標題對 (h,h') 語料庫的遊戲。圖中數字表示任務的步驟。截圖中為執行示例(h = God diagnosed with bipolar disorder;h' = Bob Dylan diagnosed with bipolar disorder;g = Obama elected president)。
圖 2:(a) 通過 Unfun.me 收集的標題對中基於 token 的編輯距離的分佈。(b) 編輯距離和嚴肅性評級權衡。(c) 基於 token 的編輯操作分佈(僅成功的標題對)。(d) 基於語塊的編輯距離分佈(僅成功的標題對)。
該研究的貢獻有兩部分。首先,該研究引入了收集諷刺性新聞標題和嚴肅性新聞標題對語料庫的線上遊戲 Unfun.me。其次,該研究對這些標題對的分析更加細粒度地揭示了諷刺性標題的關鍵屬性,這是之前研究所不具備的。
論文:Reverse-Engineering Satire, or「Paper on Computational Humor Accepted Despite Making Serious Advances」
摘要:幽默是人類的一個基本特徵。要理解幽默,首先得理解幽默和認知基礎之間的聯絡,以及幽默在社交過程中的重要性。因此,它是一個與人工智慧和人機互動相關的有前景的重要研究課題。以前關於幽默的計算研究主要是以粗粒度水平進行的,如,預測整個句子、段落或文件等是否幽默。本文的目的是對幽默進行深入理解,因此我們追求的是能使給定文字變得幽默的細粒度模型。我們先從觀察開始,發現諷刺性新聞的標題往往與嚴肅性新聞的標題類似,接著我們建立並分析了一個包含諷刺性新聞標題和嚴肅性新聞標題的語料庫,其中兩種新聞標題是兩兩成對且近乎一致的。該語料庫是通過線上遊戲——Unfun.me 構建的,它鼓勵玩家對諷刺性新聞的標題進行最小幅度的修改,以使另一個玩家相信這是嚴肅性新聞的標題。對諷刺性新聞標題的修改成功去除了幽默成分,因為它精準定位了標題中使原諷刺標題變得有趣的關鍵詞和概念。我們的分析表明,幽默成分通常在標題的末尾部分,主要是名詞短語,且大多數諷刺標題會遵循某種邏輯模式,我們稱之為虛假類比(false analogy)。總體來說,本文加深了我們對諷刺性新聞標題句法和語義結構的理解,併為構建幽默生成系統提供了一定的見解。 鄭州婦科醫院:http://jbk.39.net/yiyuanzaixian/sysdfkyy/鄭州婦科醫院哪家好:http://jbk.39.net/yiyuanzaixian/sysdfkyy/