微軟收購深度學習明星公司 Maluuba他們曾讓人工智慧讀懂權力的遊戲
原標題:重磅 | 微軟收購NLP明星公司Maluuba,Bengio將成為微軟顧問
機器之心報道 | 參與:微胖、李澤南、朱思穎
2017 年 1 月 13 日,微軟宣佈收購加拿大初創公司 Maluuba。Maluuba 由加滑鐵盧大學畢業生 Kaheer Suleman 和 Sam Pasupalak 所創,關注服務於通用人工智慧的自然語言處理研究。在此次收購中,擔任 Maluuba 顧問的 Yoshua Bengio 也同時與微軟達成了協議,進而成為微軟的顧問。目前該交易的金額尚未披露。
公司背景
加拿大滑鐵盧大學(University of Waterloo)以計算機學科聞名,2011 年 8 月 18 日,學校在讀研究生 Kaheer Suleman 發明了一款智慧程式,取名 Maluuba。同年,他與幾位同學創立了 Maluuba 公司,他們最初的想法是做一款智慧語音旅行工具,使用者可以通過語音搜尋航班。
2012 年 2 月,Maluuba 從三星風投獲得 200 萬美元種子輪投資。半年後,他們的第一款產品出現在公眾視野中,這款程式能把使用者的語音請求轉化為有用的資訊或行動。雖然不少媒體將之稱為「Android 平臺的 Siri」,但 Maluuba 的初衷卻是要挑戰 Siri,而後續發展也表明,Maluuba 的確比 Siri 更出色。
Maluuba 通過繫結第三方服務來實現語音助手功能。2012 年 11 月,公司對外發布了自然語音處理 API 介面,移動開發者可以在自己的應用中新增類似 Siri 的語音處理功能。2012 年 12 月份推出了語音購物功能,使用者可以通過語音進行購物。在語音助手領域,Maluuba 的步伐比較快。
2013 年,隨著越來越多消費類電子產品公司和裝置製造商樂於將一些新技術融入自己產品,Maluuba 也加快了與智慧手機、電視、自動駕駛汽車等公司的合作。比如,LG 旗艦 G 系列手機的 voicemate 應用就採用了 Maluuba 的技術。2013 年 2 月,Maluuba 正式宣佈向 Windows Phone 平臺遷移。Maluuba 的 Windows Phone 8 版本擁有 Android 版本的大部分功能,例如可以搜尋餐館、影院、新聞和企業(以及進行語音購物)、設定鬧鐘、提醒和會議安排、打電話、發簡訊和郵件、指示方向和天氣,甚至還集成了 Outlook 日曆。
Maluuba 最初願景是想讓機器擁有人類水平的理解力。
不過,Maluuba 成立之初就認識到,深度強化學習的基礎研究和技術成熟尚需時日。2014 年,時機趨於成熟。標誌性事件就是 DeepMind 採用了深度學習技術的人工智慧程式在無需監督的情況下,就可以掌握多種電子遊戲。
2015 年 8 月,Maluuba 融資 900 萬加元(A 輪)用於進一步推進深度學習研究。同年 12 月,Maluuba 在深度學習重鎮 — — 加拿大蒙特利爾開設了一個新的研發實驗室(有 13 名深度學習研究人員,負責人是公司 CTO Kaheer Suleman)。Maluuba 關注機器學習中的兩個細分研究領域:對話和機器理解。同時,像 Maluuba 也更關心研發解決通用問題的人工智慧,對解決真實世界問題更感興趣。他們相信自己能找出更好的人機互動方式,並與蒙特利爾大學教授、人工智慧專家 Yoshua Bengio 和阿爾伯塔大學教授、強化學習專家 Richard Sutton 等展開合作。
目前,全世界已有超過 5000 萬臺移動電子裝置(比如,智慧手機、自動駕駛汽車等)採用了 Maluuba 的自然語言處理服務。
重要成果:EpiReader
2016 年 3 月,Maluuba 登上新聞頭條。研究人員釋出論文(http://ift.tt/2jIrh8x 70%。研究人員還在《哈利波特和魔法石》上進行測試,該演算法能夠以近似的準確率回答相關文字問題。這一成績超過當時最好的神經網路方法 15%,也比當時最好的特徵工程解決方案好 2%。Yoshua Bengio 說:「從數字上看,這是一次大的飛躍。」
4 月,Maluuba 將一段技術演示視訊放上了 YouTube,視訊中的人工智慧機器人 Marcy 在閱讀了第五季《權利的遊戲》梗概後,馬上領會了故事的複雜情節。好比對這部美劇一無所知的普通人在簡單閱讀維基百科劇情介紹後,立刻弄懂了整個故事。
技術演示表明,Maluuba 已經可以處理大批量的文字資料,並且能回答更加複雜困難的開放性問題了。在機器學習和人工智慧領域,這是一個巨大的突破。Maluuba 的產品副總裁 Mohamed Musbah 表示:「人們在未來的幾個月中會看到一些非常有趣的事情。」
2016 年 6 月 7 日,Maluuba 在 arXiv 上發表了一篇論文《Natural Language Comprehension with the EpiReader》(arXiv:1606.02270),介紹了一種全新的機器文字理解模型 EpiReader。
在之前機器之心的專訪中,Maluuba 介紹說,EpiReader 採取兩個步驟來確定問題答案。第一步 (Extractor), 我們使用了一個雙向 GPU 逐字閱讀故事和問題,接著採用一種類似 Pointer Network 中的 Attention 機制在故事中挑選出可能作為答案備選的單詞。第二步 ( Reasoner ),這些備選答案被插入「完型填空」式的問題中,構成一些「假設」,接著卷積神經網路會將每個假設與故事中的每個句子加以比較,尋找文字蘊涵 ( Textual Entailment ) 關係。簡單來說, 蘊涵是指,兩個陳述具有很強的相關性。因此,最近似故事假設的蘊涵得分最高。最後,將蘊涵得分與第一步得到的分數相結合,給出每一個備選答案正確的概率。
最近,Maluuba 釋出了一篇新的技術部落格,介紹他們在通用人工智慧上的研究(參閱《構建好奇的機器,Maluuba 的通用人工智慧探索(附論文)》)。
與微軟合作的原因:通用人工智慧
Maluuba 在官方部落格上解釋道:
到目前為止,我們關注的領域是機器閱讀理解,對話和理解以及通用(人類)智慧,比如記憶、常識推理以及資訊搜尋行為。這些領域的早期研究成果加快了我們擴展團隊的需求,顯然,我們需要用重要資源來支援我們的團隊以推進終極目標的實現。
微軟非常契合我們的公司。微軟大眾化人工智慧的雄心讓這個星球上每個人和組織與人工智慧技術使用方式從根本上保持一致。微軟為我們提供了將我們的研究傳遞給百萬個人使用者和公司使用者的機會,他們可以從真正智慧機器的出現中受益良多。另外,微軟龐大的技術資源 — — 包括後端基礎架構(如微軟Azure和其完備的硬體基礎設施)以及工程人員將幫助我們加速研究和提供市場解決方案的步伐。簡言之,我們的新拍檔能讓我們更加快速的走向當初的願景。
微軟也表示,Maluuba 在深度學習和強化學習方面的專業知識將幫助我們解決問題和決策系統推進我們的人工智慧民主化策略,並使其可以為每個人服務 — — 所有消費者,企業和開發者。隨著最近微軟在語音識別和影象識別上使用深度學習技術的巨大成果,以及今天來自 Maluuba 成員的新力量,公司相信「更好的還在後面,我們將向機器閱讀和寫作發起新的進攻。」
此外,不久之前微軟在其官方部落格上開放了一個包含 10 萬個問題和答案的資料集 MS MARCO。通過將資料集免費開放給領域內更多的研究者,微軟希望能夠推進機器閱讀領域的突破性研究。這個開源資料集的負責人 Rangan Majumder 曾說,「為了實現人工通用智慧的目標,我們首先需要機器能夠像人類一樣閱讀和理解文件。這個資料集是向這個方向邁出的一步。」
微軟的長期目標一直是通用人工智慧,Maluuba 的研究能夠助力微軟實現這一巨集偉目標。優勢互補,微軟收購 Maluuba 也就不足為奇了。
蒙特利爾的人工智慧領域地位正在獲得認可
這次收購表明,蒙特利爾在人工智慧領域的重要地位最近正在逐漸被全球各大公司認可。在微軟之前,谷歌曾在 2016 年 11 月宣佈在蒙特利爾成立一個新的人工智慧研究機構,並對該市的幾所大學進行了投資。值得一提的是,谷歌在這一動作中試圖拉攏的 Yoshua Bengio — — Maluuba 的顧問也隨著這次收購與微軟產生了聯絡。在所有大公司都在爭搶人工智慧領域人才的環境中,微軟的努力或許另有深意。
Maluuba 表示,「沒有 Yoshua Bengio 教授(深度學習創始人之一)、Richard Sutton(最重要的強化學習先驅)以及蒙特利爾日益壯大的研究生態圈的巨大幫助,我們無法走到今天。特別是,Bengion 教授為我們的研究人員的研究工作提供了非常寶貴的常規諮詢和指導。過去幾年中,Bengio 教授也因為他的遠見 — — 將蒙特利爾打造成人工智慧研究的核心而得到了特別認可。通過蒙特利爾大學和麥克吉爾大學的研究,這座城市已經發展成為世界上最大的深度學習學術中心;現在,這個區域大學中有大約 150 深度學習研究人員。加拿大的學院、公司以及創業公司生態系統正為人工智慧領域帶來巨大創新,證明加拿大,特別是蒙特利爾能夠與矽谷試比高下。在這一新的篇章裡,我們會繼續積極地與蒙特利爾以及發表世界頂級人工智慧研究的學術社群合作。」
成功的祕訣
前一段時間,在接受機器之心專訪時,Maluuba 給其他人工智慧創業者和研究人員給出的一些建議或許可以作為公司邁入今天這一新篇章的重要經驗之一。
人工智慧方面。我想說,此時創業正當時,也很讓人興奮,因為這裡需要解決很多令人激動的問題,這個行業已經到了這樣一個階段:我們正處在解決這些問題的前沿,而且公司非常高興支援真正的創業者來解決這些問題,無論是資金上還是策略能力上。現在成為這個領域的創業者,很讓人激動。
但是,我想提醒需要注意的幾點。
首先,區分事實和虛構。很多人工智慧領域裡的資訊都過分誇張了,因為對現狀缺乏基本瞭解,而且對人工智慧持過於興奮態度也源於人類本性。區分事實和虛構能幫助你真正理解自己所處的位置,幫助你準確定位所要解決的問題。
第二點就是挑選別人沒有解決過的獨特問題,然後試著如何用人工智慧加以解決,看看自己解決的情況如何,和別人有什麼不同。我認為幾年後,這個領域的公司就要比拼:看誰能利用最先進的技術做出沒有人想到新產品,解決別人沒有解決的問題。
援引 T.S. Eliot 一句話作為本文的結束:「In our end is our beginning.」
©本文為機器之心原創,轉載請聯絡本公眾號獲得授權。
Originally published on Wordpress