筆記:人類的勝利——人工智慧、AlphaGo雜談
阿新 • • 發佈:2018-11-10
2016年——一個特殊的年份
2016年是機器智慧歷史上一個具有紀念意義的年份,它是一個時代的結束,也是一個新時代的開始。
- 1956年,人工智慧概念提出。
2016年,人工智慧概念60週年,提出此概念的最後一名科學家辭世,AlphaGo戰勝人類。
談談 AlphaGo
計算機之所以能戰勝人類,是因為機器獲得智慧的方式和人類不同,他不是靠邏輯推理,而是靠大資料和智慧演算法。
- 在資料方面,AlphaGo採用了即使碗盤圍棋高手的對弈資料來進行訓練,這使他獲得所謂“智慧”的原因。
- 在計算方面,AlphaGo 採用了上萬臺伺服器來訓練下期模型,並且讓不同版本的 AlphaGo 相互對弈了上千萬盤。
下棋策略,AlphaGo裡面有兩個關鍵技術:
- 把棋盤上的當前狀態變成一個獲勝的概率模型:這個模型沒有任何人干預,完全是靠大資料訓練出來的。
- 啟發式搜尋演算法:蒙特卡洛樹搜尋演算法(Monte Carlo Tree Search),它能將搜尋空間限制在非常有限的範圍內。
雖然AlphaGo訓練用了上萬臺伺服器,但在實際比賽中,僅用了幾十臺伺服器(1000多個CPU+100多個GPU)。圍棋的狀態空間比國際象棋高出很多個數量級,但是AlphaGo的計算能力和深藍相比,並沒有多少提升,這裡面靠的是搜尋演算法有想性的提升。