1. 程式人生 > >人機大戰|人類柯潔博弈智能AlphaGo誰輸輸贏

人機大戰|人類柯潔博弈智能AlphaGo誰輸輸贏

人機大戰 人工智能 AlphaGo

人工智能與人類智慧的再一次正面對決,5月23日上午,“中國圍棋峰會”在烏鎮拉開帷幕,備受關註的世界第一棋手柯潔與AlphaGo 2.0的第一場比賽於10:30正式開始。新版AlphaGo擯棄了人類棋譜,只靠深度學習的方式成長起來挑戰圍棋的極限。


在開賽前夜,柯潔更新微博表示“現在的AI進步之快遠超我們的想象,可它始終都是冷冰冰的機器,與人類相比,我感覺不到它對圍棋的熱情和熱愛,無論結果,這將是我最後的三盤人機大戰”。

AlphaGo深度學習
AlphaGo 是第一個擊敗人類職業圍棋選手並戰勝圍棋世界冠軍的程序。
為了應對圍棋的巨大復雜性,AlphaGo 采用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網絡(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。然後,訓練出一個價值網絡(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。這兩個網絡自身都十分強大,而 AlphaGo將這兩種網絡整合進基於概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo 產生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往復。

AlphaGo 如何決定落子?

在獲取棋局信息後,AlphaGo 會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。

在剛剛結束的AlphaGo與柯潔的首場比賽中,AlphaGo以1/4子獲勝。

在此之前創新工場李開復評價道,此次對決人類勝率幾乎為零。AlphaGo 采用了一種新穎的機器學習技術,人工智能的發展超越了人類思維的高速運算,人工智能越來越多的被應用到人臉識別打卡系統,商城服務機器人,百度大腦, 醫護陪伴機器人,東時Python人工智能課程
深入Python機器學習,輸入學子進入人工智能世界, 機器跟人類智慧的交鋒將再次推動人工智能和人類社會的發展。

人機大戰|人類柯潔博弈智能AlphaGo誰輸輸贏