1. 程式人生 > >人工智慧再次超越人類,這次是閱讀理解

人工智慧再次超越人類,這次是閱讀理解

在斯坦福大學舉辦的閱讀理解比賽中,由微軟和阿里巴巴分別獨立開發的人工智慧的得分都超過了人類。

在斯坦福大學舉辦的閱讀理解比賽中,由微軟和阿里巴巴分別獨立開發的人工智慧(AI)模型的得分均超過了人類。

這一人工智慧里程碑是藉助斯坦福大學問答資料集(Stanford Question Answering Dataset,SQuAD)實現的。該資料集由對應於500篇以上維基百科(Wikipedia)文章的超過10,000個問答對組成。阿里巴巴模型的得分為82.44,而微軟亞洲研究院(Microsoft Research Asia)提交的模型則超過了這一成績,得分為82.65。人類在SQuAD測試中的得分為82.304。

儘管是以微弱優勢取勝,稱不上表現優秀,但這代表自然語言處理(NLP)軟體首次得以在這一特定基準上超越人類。谷歌、IBM、Facebook、騰訊、三星、Salesforce和其他公司也已向這項測試提交了自己的模型,但目前為止沒有任何模型達到人類的閱讀理解水平。

阿里巴巴和微軟的成就表明,NLP技術的水平距離在諸如客戶服務、旅行和醫療保健等領域的商業應用程式中扮演更重要的角色越來越近。如果與搜尋引擎配對,可利用這項技術為企業和消費者提供所有型別的有用互動。微軟表示,已在自己的必應(Bing)搜尋引擎中集成了其SQuAD模型的早期版本。

微軟稱,軟體開發人員正在努力使用這項技術將上下文引入這些互動中。微軟的人工智慧部落格中提到:例如,假設您詢問某個系統“德國總理出生於哪一年”,那麼當您提出後續問題“她出生在哪座城市”時,您可能會想要它理解自己仍然在談論同一件事。

儘管NLP領域出現了這一最新進展,微軟亞洲研究院副院長周明承認,整體而言,人類在理解語言的複雜程度方面仍然比軟體優秀。“自然語言處理領域仍存在許多挑戰,我們大家都需要繼續投資並推進其發展,”周明表示。“這一里程碑只是一個開端。”

這一觀點得到了紐約大學電腦科學部門教授兼長期人工智慧研究者歐內斯特·戴維斯(Ernest Davis)的詳細闡述,他的觀點被《華盛頓郵報》上一篇有關此話題的文章引用。戴維斯承認,儘管阿里巴巴和微軟的工作成果令人印象深刻,但許多閱讀理解基於閱讀任何特定文章前已經瞭解的內容。而這些模型不會將此類上下文納入其中。

640?wx_fmt=png640?wx_fmt=jpeg