聊天機器人最難理解的 10 個詞彙
簡評:現在,越來越多的「聊天機器人」憑藉著人工智慧能與人類對話,甚至編寫新聞。人們該如何判斷對方是一個血肉之軀,還是一個可笑的演算法?又該如何判斷一個小說故事是由一臺機器編寫的,而不是由一位真正的人類作家精心撰寫的?
設想一個場景,你和一個智慧機器人站在一位法官面前,但法官看不到你們。
你們必須從詞典裡挑選一個詞告訴法官,而法官通過這個詞來判斷誰才是真實的人類。
你會選擇哪一個詞呢?
你會選擇「靈魂」這樣能夠表達精神概念的詞,還是選擇能夠表現個人品味的詞,比如「音樂」?抑或是選擇一個表述基本身體功能的詞,如「放屁」?
這個簡單的設想實驗看起來可能很奇特,但一些認知科學家認為 —— 這一設想有助於闡明我們對人工智慧的基本假設,同時也揭示了一些關於人類思想的見解。
目前區分機器和人類還是很容易的,但隨著機器變得越來越聰明,我們就需要找到方法辨別我們接受的對話或文字是否來自機器人
麻省理工學院做這項研究的研究人員之一 John McCoy 說,他的最初靈感來自與同事的閒聊。他們正在討論「圖靈測試」,該測試旨在判斷機器的智慧行為和人類智慧能否被區分開來。
McCoy 解釋說,在推測是否可以只用一個單詞來讓法官作出判斷之前,我們想過「圖靈測試」中人們能夠想到的最簡單的詞應該是什麼。
因此問題就是,人們實際上會說出哪些詞呢?正是受這個問題的啟發,最終才會有今年發表在《實驗社會心理學雜誌》上的那篇研究論文(Journal of Experimental Social Psychology
在第一個實驗中,研究人員要求 1000 多名參與者回答上述問題,然後分析了參與者們提到的所有詞語,試圖找到常見模式。
最受歡迎的十個詞如下:
- Love 愛(134 條回覆)
- Compassion 同情(33)
- Human 人類(30)
- Please請(25)
- Mercy 憐憫(18)
- Empathy 同理心(17)
- Emotion 情感(14)
- Robot 機器人(13)
- Humanity 人性(11)
- Alive 活著(9)
「愛」這個詞將是機器人在很長一段時間內都很難弄懂的概念
McCoy 表示 —— 人與人之間的趨同性著實令人驚訝。人們可以從標準的英語詞典中選擇他們喜歡的任何單詞,但這些選擇竟然存在如此強大的共性。
就拿「Love」這個詞舉例 —— 將近 10% 的參與者選擇了它;總體來看,1/4 的參與者選擇了排名前 4 的詞語。
就一般主題而言,最受歡迎的詞是傳達身體功能(如「大便」)、信仰和寬恕(如「憐憫」或「希望」)、情感(如「同理心」)和食物(如「香蕉」)等。
「幽默」、「諷刺」,以及與身體機能相關的詞語有助於辨別我們是血肉之軀而不是機器人
隨後,McCoy 進行了第二次實驗,看看其他人如何迴應第一次實驗中提出的詞。最受歡迎的詞是否恰當地體現了血肉之軀的人的特點?如果是這樣,哪些詞是最恰當的?
為了找到答案,研究人員將最受歡迎的詞以各種形式(例如「人類」和「愛」)組合在一起,並要求另一組參與者確定哪一組最有可能是人提供的,哪一組是計算機提供的。
正如第一項研究中一樣,「愛」被證明是最恰當的詞語之一。但是在可選範圍內,排名最高的詞竟然是「大便」。
令人驚訝的是,糞便其實是一種人類禁語,但這一測試結果表明,相比簡單地描述情感,明智地蔑視並挑釁禁忌可能是傳達人類特點最直接的方式。人們的腦海中也會浮現更多豐富多彩的詞語。
還有一些詞語是人類才會使用以傳達類似的強烈情緒反應,例如,「潮溼 Moist」或「請」,這些詞語這時傳達的含義已超出了詞典的定義。
究其原因,可能是對當前人工智慧狀態相對公平的反應。雖然機器現在可以編寫基本的描述性句子甚至是可理解的短篇小說,但暫時還很難理解「幽默」和「諷刺」。畢竟,「幽默」需要深刻理解語境以及每個詞語涵蓋的各種文化意義。
某些詞會產生深刻的情感反應,超出了詞典的定義,如「潮溼」
這個實驗或許還可以作為理解人們對其他群體看法的有效工具,比如你會選擇哪個詞來證明自己是一個女人?無論哪種情況,你選擇的詞應該是隻有特定群體成員內部才瞭解的特質,而這種特質是群體以外的人不瞭解甚至可能忽略的。
總的來說,在這個越來越智慧化的世界裡,如果你確實需要證明自己是一個人,那就儘可能粗魯一點、有趣一點。
原文連結:
What single word defines who you are ?