1. 程式人生 > >AlphaGo棋手Master戰勝聶衛平與柯潔60連勝

AlphaGo棋手Master戰勝聶衛平與柯潔60連勝

北京時間1月5日訊息,谷歌 DeepMind 開發的AI在圍棋棋盤上戰勝韓國世界冠軍之後再度重返,這一次AlphaGo 在網上戰勝了頂尖棋手,而且是悄悄進行的。最近幾日,名為“Master”(大師)的神祕賬號在各大圍棋網站橫掃頂尖職業棋手。

1月4日下午,神祕賬號“Master”(大師)繼續在野狐圍棋網上挑戰人類頂尖高手,第54局,中國棋聖、64歲的聶衛平出戰。本局“Master”特意把比賽用時調整為每方1分鐘一手,以示對聶衛平的尊敬。最終本局進行至手,執白的聶衛平以7目半的劣勢落敗。在Master揭開面紗神祕面紗之後,先前敗給Master的世界圍棋第一人柯潔也隨即在微博上表示:“感謝AlphaGo

最新版給我們棋界帶來的震撼,作為一開始就知道真身是誰的我來講,是多麼希望網上的快棋人類能贏一盤。若不是住院,我將用上那準備了一個星期的最後一招…略有遺憾,希望這網路公測的最後一盤,古哥能發揮出人類的極限水平!@古力”

AlphaGo棋手Master戰勝聶衛平柯潔60連勝 幕後工程師為黃士傑

氧分子網www.yangfenzi.com)瞭解到,1月4日晚,隨著古力認輸,Master對人類頂尖高手的戰績停留在60勝0負1和。包括聶衛平、柯潔、樸廷桓、井山裕太在內的數十位中日韓圍棋高手,在30秒一手的快棋對決中落敗。總計 Master 上線短短5天打了61場比賽,以60戰全勝的戰績收場(其中一場對手離線,判和局)。棋盤上打敗人類的不止深藍和AlphaGo!圖靈、夏農、馮·諾依曼

Master擊敗的棋手名單中,包括中國世界冠軍:古力(3次),柯潔(3),陳耀燁(3),範廷鈺(2),常昊(1),時越(1),羋昱廷(1),唐韋星(1),江維傑(1),柁嘉熹(1),周睿羊(1)。韓國世界冠軍樸廷桓(5次),元晟溱(1),姜東潤(1),金志錫(1),朴永訓(1)。

此外,中華臺北世界冠軍周俊勳,日本第一人井山裕太落敗。中國的連笑、檀嘯、孟泰齡等新秀名將,女子第一人於之瑩,韓國超級新銳申真諝等皆出戰敗北。

AlphaGo棋手Master戰勝聶衛平柯潔60連勝 幕後工程師為黃士傑

這個強悍的勝率加上落子如飛的下棋速度,讓大家確信“大師”身後站的肯定是一個圍棋人工智慧。之前許多人都在猜測這位圍棋高手是誰,大家都不確定,有人懷疑它是電腦。中國棋手古力懸賞10萬元,尋找可以打敗“Master”的棋手。

今天早些時候,谷歌 DeepMind 創始人德米什·哈薩比斯(Demis Hassabis)在Twitter釋出訊息,證實升級版 AlphaGo 在網上與真人對決。DeepMind 釋出的訊息顯示,非正式測試可能已經結束,今年晚些時候,AlphaGo 將會參加一些正式比賽。

德米什·哈薩比斯寫道:“在過去幾天裡,我們在網上進行了一些非正式圍棋比賽,對局以快棋的形式進行……我們的目的只是為了檢視系統是否如預期一樣好。”他還說:“感謝那些在弈城圍棋網和野狐圍棋網與我們對弈的棋手,我們的賬號是Magister(P) 和Master(P),我們還要感謝那些觀戰的人。”

AlphaGo棋手Master戰勝聶衛平柯潔60連勝 幕後工程師為黃士傑

一直以來,我們都在努力改進AlphaGo,在過去幾天裡,我們進行了一些非正式網上比賽,對局以快棋的形式進行,參加比賽的是最新開發的原型版系統,進行網上對決只是為了檢查系統,看它是不是和預料的一樣好。感謝那些在弈城圍棋網和野狐圍棋網與我們對弈的棋手,我們的賬號是Magister(P) 和Master(P),我們還要感謝那些觀戰的人。

新版AlphaGo在比賽中下出了一些富有創意、非常漂亮的棋步,我們和圍棋社群從中學到了許多東西,對此我們感到很興奮,結果讓人滿意。AlphaGo之父戴密斯·哈薩比斯:除了下圍棋,AI還要塑造人類未來

與AlphaGo對弈之後,棋手古力發帖稱:“人類與AI攜手合作,很快將會揭開圍棋的深層祕密。”現在我們的非正式測試已經結束,今年我們準備與圍棋組織、專家合作,舉辦正式、完整的比賽,進一步探索圍棋的祕密,讓人類與AI互相啟迪,共同進步。很快我們就會公佈更多訊息。

AlphaGo的核心作者黃士傑:穿過狗的棋局的他的手

在去年初AlphaGo與南韓圍棋名將李世乭(右)的對戰中,黃士傑(左,Aja Huang)就是負責幫AlphaGo下棋的人。

在去年初AlphaGo與南韓圍棋名將李世乭(右)的對戰中,黃士傑(左,Aja Huang)就是負責幫AlphaGo下棋的人。

中國圍棋網站最近出現名為「Master」的神祕棋士,連敗中、日、韓圍棋冠軍及多名好手,創下60連勝的佳績,它的真實身分在4日晚間揭曉,原來是AlphaGo推手、臺灣博士黃士傑(Aja Huang)。黃士傑是谷歌 DeepMind 的資深研究員,也是 AlphaGo 的主要程式開發者,臺灣出身的黃士傑博士。黃士傑博士畢業於臺灣師範大學,博士論文就是以“應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演演算法”,本身也是業餘六段的圍棋棋手。劉黎平:史記《李世石大戰阿爾法記》

黃士傑(Aja Huang)不久前在Facebook寫到:

我們最近很努力地開發AlphaGo,剛過去的幾天我們在網路的對弈平臺進行了一些非正式的快棋對局,目的是為了檢驗我們最新版本的AlphaGo是否如我們的預期。我們感謝所有與我們的 Magister(P) 和 Master(P)帳戶在弈城圍棋網以及野狐圍棋網對弈的棋手,也要感謝所有觀戰的人!最新版的AlphaGo在對局中所富有啟發性的創新,我們從中可以學到的,以及對局的結果都令我們非常激動。

世界冠軍古力九段與AlphaGo對局以後,說“人類與人工智慧共同探索圍棋世界的大幕即將拉開”。我們現在結束了非正式的測試,非常期望今年能有機會與圍棋組織以及專家共同探索圍棋,在相互啟發的氣氛中共同領會圍棋的奧妙。我們希望儘快釋出其他公告。

黃士傑(Aja Huang)

AlphaGo的核心作者黃士傑:穿過狗的棋局的他的手

2016年3月,由谷歌公司開發的人工智慧軟體,以4比1的總比分擊敗韓國棋王李世石,引起全世界範圍內的關注,AlphaGo的幕後推手,臺灣工程師黃士傑也吸引了眾多媒體的關注。黃士傑是谷歌設計團隊中最熟悉圍棋的工程師,被臺灣媒體愛稱為“幫AlphaGo下棋的人”。

AlphaGo 開發成員黃士傑表示:‘我在師大學習的論文,成為我做出 AlphaGo 的基礎。’並表示:‘我覺得臺灣很多工程師都很厲害,但是一方面我們的資源比較少、一方面很多人都比較沒有信心。’鼓勵臺灣開發者要勇敢走出去。更多AlphaGo解讀:www.yangfenzi.com/tag/alphago

黃士傑從小熱愛圍棋,在臺灣師大讀書時就曾經創辦了學校的圍棋社,還曾獲得大專杯圍棋賽冠軍,是個業餘六段圍棋選手。黃士傑碩士論文的指導老師林順喜提起少年的他仍然非常驕傲,據林順喜介紹,學生時代,黃士傑就醉心研究圍棋軟體開發,原本他5年就可以畢業,但為了延續自己的研發成果,又在學校多留了兩年,直到他在臺師大修業的第7年,他設計的軟體參加國際電腦奧林匹克競賽,獲得19路電腦圍棋金牌,他開發的程式更是擊敗了當時圍棋AI公認最強的程式“Zen”,在業內引起極大的轟動。

黃士傑(Aja Huang),高中的時候在臺北成功高中,擁有臺灣交通大學(National Chiao Tung University)計算機與資訊科學學士,臺灣師範大學(National Taiwan Normal University)電腦科學與資訊工程碩士與博士。在校取得了輝煌成績的黃士傑通過博士論文口試之後就被加拿大阿爾伯塔大學(University of Alberta)挖走,擔任電腦圍棋程式研究員,1年後被英國一家專門研究人工智慧的公司DeepMind 招攬,和David Silver並列首席設計師,2014年,DeepMind 公司被谷歌併購,黃士傑因此延續圍棋程式開發,黃士傑已是公司內兩位首席工程師之一。

黃士傑指出,人類在下圍棋,除了平常的計算之外,最主要的是因為‘直覺’。透過這個原理,DeepMind 直接讓 AlphaGo 跟深度學習結合,主要的網路是‘策略網路’跟‘值網路’,策略網路可以判斷出最佳棋路,就好像人類用直覺來下出好棋一樣,開發團隊也會事先給 AlphaGo 閱讀各種不同參考棋譜。至於‘價網路’則是在搜尋一個點之後,會判對盤面,搜尋誰優勢,主要功能就是判斷優勢。

簡而言之,策略網路減少搜尋的廣度,價值網路著重減少搜尋的深度,黃士傑表示,其實 DeepMind 團隊已經把所有開發過程與論文內容上網對外公開,讓任何人都可以複製 AlphaGo 的技術,甚至他也發現已經有網友翻譯成繁體中文版。《自然》論文詳解:AlphaGo 背後的深度神經網路和樹搜尋

針對未來發展方面,黃士傑表示,DeepMind 有興趣的領域除了圍棋之外,還有‘醫療’跟‘機器人’,希望能夠讓世界變得更美好,至於他自己個人的下一步,當然就是選一個有興趣的領域去投入。現場有媒體再次詢問下一個目標是不是挑戰《星海爭霸》、《英雄聯盟》這個模擬策略遊戲領域,黃士傑並沒有把話說死,表示:‘內部還在討論’。除了AlphaGo,Google人工智慧公司DeepMind要進軍醫療保健領域

黃士傑(Aja Huang)

導師林順喜口中的黃士傑

黃士傑在臺師大讀碩博時的導師林順喜,指導了他的碩博論文《計算機圍棋打劫的策略》和《應用於計算機圍棋之蒙特卡羅樹搜尋法的新啟發式演算法》,博士論文中法國教授Rémi Coulom為共同指導老師。而這位Rémi Coulom研發的Crazy Stone是在AlphaGo之前最有名的圍棋軟體之一。林順喜回憶,黃士傑是個很努力的學生,是臺師大圍棋社創社社長,就讀時就有圍棋業餘6段的資格,而且黃士傑讀碩士時就鎖定圍棋為他的研究課題。林順喜說,為了寫程式,黃士傑有時在實驗室一呆就是16小時。

提到黃士傑研發的圍棋程式“Erica”,林順喜爆料,Erica其實就是黃士傑太太的英文名字。林順喜說,黃士傑其實外表看起來很宅的,“在實驗室的10年中,從沒看他帶女朋友過來,但突然有一天,黃士傑跟我說‘我要結婚了’,我還大吃一驚‘怎麼都沒看過你老婆!’”臉書主頁顯示黃士傑的太太Erica Huang,中文名字是陳淑貞,和黃士傑一樣同是臺灣人。2007年黃士傑博士四年級的時候,兩人相識。整天與電腦程式打交道的黃士傑,在戀愛方面,並不輸一般的文藝青年。黃士傑曾在臉書上貼出與太太Erica認識不久時候為她準備的一份別樣的生日禮物,他用電子琴為Erica錄製了一首曲子。黃士傑將這首曲子命名為《Erica之歌》,並調侃,從國中開始學習的電子琴,終於派上了用場。

學妹張曉茵筆下的黃士傑

或許,人們對他更多的瞭解來自於他的學妹——臺灣圍棋記者張曉茵。李世石在輸掉與AlphaGo的第二局後,北京晨報記者與張曉茵取得了聯絡,希望請她講講關於黃士傑的故事,但張曉茵婉拒了,她說她已經將自己所瞭解的這位學長的故事寫在了之前的文章裡。在網際網路上可以順利搜尋到那篇文章,這是張曉茵今年除夕時所寫下的,而當時AlphaGo戰勝了樊麾二段。看到這則訊息的張曉茵馬上想起了黃士傑:2007年就讀臺師大研究所期間,張曉茵召集了師大對圍棋感興趣的學弟學妹們創辦圍棋社。作為學長,就讀資訊工程研究所的黃士傑加入圍棋社,他當時是臺灣業餘6段,張曉茵說,自己有關於圍棋AI的知識都是在那時聽黃士傑所說。

專注於圍棋AI研究開發的黃士傑為人低調,張曉茵透露,自己也是在去年才知道他加入了DeepMind,雖然張曉茵想多向他了解一些關於AlphaGo的資訊,但黃士傑表示,AlphaGo是整個團隊的貢獻,很多事情目前都需要保密。但從黃士傑之後的宣告和谷歌縝密的籌備與醞釀來看,張曉茵當時就表示,自己更看好AlphaGo。值得一提的是,張曉茵提到黃士傑也是一個音樂愛好者,甚至能自己用MIDI作曲並彈奏,“這樣一位理性與感性兼備的計算機工程師所在的團隊,開發出來的計算機程式,或許會想過把一些人性元素放進去”。人機大戰結束了,AI 投資才剛剛開始

黃士傑(Aja Huang)

風口浪尖裡的黃士傑

人們對AlphaGo越好奇,也就對它的開發者越感興趣,但直到今天,黃士傑關於人機大戰所發出的,也只有兩條宣告而已。

第一則宣告與一個“謎”有關,此前很多網友在弈城注意到一個DeepMind的賬號,這是一個英國賬號,註冊段位為5D,之後幾次升降,在2015年9月16日升上弈城9D。2015年12月,DeepMind在弈城首次擊敗P號選手(即職業棋手),其後又相繼戰勝兩個P號。專注於研究人工智慧圍棋的韓國六段金燦佑認為,該賬號5D時的棋譜中,有明顯的人工智慧圍棋軟體痕跡。更多deepmind解讀:www.yangfenzi.com/tag/deepmind

而且在此次人機大戰開戰前,李世石曾公開表示,AlphaGo此前與英國棋手樊麾的5局比賽他都已看過,此外他還在弈城的賬號中看過另外的兩局比賽,綜合考量,李世石曾表示自己打敗AlphaGo不在話下。之前就有專家稱,弈城賬號最多是AlphaGo的部分模組測試,如果以此評估AlphaGo的水平,必然會有巨大落差。

對於這些猜測,黃士傑今年1月29日給予迴應稱:“弈城的DeepMind是我本人在用的賬號,並不是AlphaGo。我本人喜歡下圍棋,棋力是臺灣業餘6段。但AlphaGo肯定是比我強太多了。”

黃士傑最近一次發聲就是在人機大戰期間,同樣與一個“謎”有關——由於在AlphaGo與李世石的前兩盤對弈中沒有出現打劫,被外界質疑“是否有不能打劫的祕密協議”,黃士傑宣告稱:“這次比賽並沒有所謂的不能打劫的保密協議……我們也想知道,AlphaGo在對陣李世石九段這種級別的棋手,打劫時的表現。”