谷歌圍棋人工智能AlphaGo今天與韓國棋手李世石的人機圍棋大戰塵埃落定,AlphaGo拿下最后一場,將總比分定格在4:1。雙方聯手為世人貢獻了五場精彩絕倫的圍棋比賽,比賽結束了,而相關的話題討論才剛剛進入高潮。
關注
其實人們最關注的話題集中在以AlphaGo代表的人工智能是否會取代人類上,AlphaGo之父、DeepMind聯合創始人德米斯·哈薩比斯表示,圍棋是一種”完全信息博弈”,比賽雙方所有信息都呈現在棋盤上。而例如撲克和電腦游戲等由多人參與的對戰游戲是”不完全信息博弈”,計算機無法獲知所有信息,目前這些領域對人工智能來說還存在困難。另外,對DeepMind來說,他們研發AlphaGo的最終目標指向為智能手機助手、醫療健康和機器人,只是目前先在圍棋領域測試系統,達到檢測其學習能力算法的目的。所以大可不必過于驚慌,將此番圍棋較量上升至保衛”人類智慧最后一塊高地”的地步。
哈薩比斯稱,人工智能的下一步目標是讓計算機自己學棋。也就是說,下個版本的AlphaGo將從零開始,不接受人類的灌輸的特定知識,做到真正的自主學習。
回顧:
人機大戰首局:李世石中盤認輸
北京時間3月9日,李世石執黑先行,為打亂電腦布局采用新走法,AlphaGo應對不佳,出現失誤。在中盤階段的勝負關鍵時期,AlphaGo下法變得強硬,雙方展開接觸戰。李世石圍住一塊大空,在大局上搶得先機。隨后李世石卻放出了非常業余的手法,瞬間使微弱的優勢化為烏有,進入官子,AlphaGo根本不犯一點錯誤,著著精準,李世石算清后投子認輸。
人機大戰次局:李世石完敗
北京時間3月10日,AlphaGo執黑先行,李世石轉變行棋風格,開局下得非常穩健。AlphaGo也下出了不少新手,這讓李世石應對得非常謹慎,黑37和41兩步尖沖令人匪夷所思,尤其是第41手,致目數大虧。中盤階段,本來形勢占優的李世石行棋過緩,右上角的一步二路打拔被視作敗手,AlphaGo的優勢逐漸清晰起來。在形勢陷入被動的情況下,李世石下出一手扳的好棋,但幾次轉換后,黑棋還是牢牢守住了領先的局面,而且棋形很厚。李世石無力改變,AlphaGo執黑獲勝且優勢明顯,總比分2-0領先。
人機大戰第三局:李世石破釜沉舟未果
北京時間3月12日,李世石執黑先行,布局階段,李世石左下掛角后走高中國流。行不到二十手,李世石局面就落入下風。隨后,雙方在左上角展開戰斗,AlphaGo對全局的把握一如既往地強大。李世石不但自己的模樣被對手輕松打入,AlphaGo還借助戰斗在下邊圍起一大塊空,局面看上去還不如前兩盤好看。隨后的比賽,雖然李世石仍然極力抵抗,并且祭出劫爭的手段,但是電腦精確應對,讓他無功而返,只有投子認負。
人機大戰第四局:李世石祭出”神之一手”獲首勝
北京時間3月13日,李世石祭出白78″挖”妙手,AlphaGo被李世石的”神之一手”下得陷入混亂,走出了黑93一步常理上的廢棋,導致棋盤右側一大片黑子”全死”。此后,”阿爾法圍棋”判斷局面對自己不利,每步耗時明顯增長,更首次被李世石拖入讀秒。最終,李世石冷靜收官鎖定勝局。
人機大戰第五局:李世石執黑280手認負
在上局比賽扳回一城后,李世石向AlphaGo團隊提出要在末戰中執黑,因為他覺得AlphaGo執黑時發揮并不完美,戰勝執白的AlphaGo才更有意義。執黑的李世石選擇了穩健的錯小目、無憂角開局,AlphaGo則以二連星應對。李世石和79和81手連出緩手,被視為敗招。AlphaGo82靠也并非好的應手,一波錯進錯出后,黑棋在87和89手再出緩手,致使白棋左上角的圍剿更加有力,黑棋形勢瞬間坍塌。此后,占據優勢的AlphaGo展現了它強大的中后盤計算能力,鮮有失誤,落子效率極高。不過李世石也并未放棄,連續走出強硬應手,可惜棋盤下得越來越小,難再覓逆轉機會。第280手,李世石投子認負。
AlphaGo原理
在人機大戰開始前,職業棋手們幾乎一邊倒地傾向于李世石。就連這個性格執拗、棋風兇悍的韓國人也認為5比0不成問題,只是在開賽前了解到AlphaGo自我學習的原理后,才略有擔心。其實在科技界人士看來,代表人工智能頂尖水準的AlphaGo勝出同樣是大概率的事情。
傳統的人工智能方法是將所有可能的走法構建成一棵搜索樹,但這種方法對圍棋并不適用。AlphaGo則是將高級搜索樹與深度神經網絡結合在一起,這些神經網絡通過12個處理層傳遞對棋盤的描述,處理層則包含數百萬個類似于神經的連接點。
其中一個神經網絡”決策網絡”(policynetwork)負責選擇下一步走法,另一個神經網絡”值網絡”(“valuenetwork)則預測比賽勝利方。谷歌方面用人類圍棋高手的三千萬步圍棋走法訓練神經網絡,與此同時,AlphaGo也自行研究新戰略,在它的神經網絡之間運行了數千局圍棋,利用反復試驗調整連接點,這個流程也稱為鞏固學習(reinforcementlearning)。通過廣泛使用Google云平臺,完成了大量研究工作。
AlphaGo在與人的對弈中用了”兩個大腦”來解決問題:”決策網絡”和”值網絡”。通俗來說就是,一個大腦用來決策當前應該如何落子,另一個大腦來預測比賽最終的勝利方。
值得一提的是,李世石也是第一次與機器對戰,所以他無法像和人類對戰那樣,先研究對方的棋譜和下棋風格。李世石所能做的就是和自己對弈。AlphaGo也是通過這種方式鍛煉自己,真正做到了”人工智能”。
聲音:
“這是我的失敗,’阿爾法圍棋’很強大。但這不代表了人類棋手的失敗,更不代表圍棋的失敗。”–李世石九段
“棋道一百,我只知七。”–日本棋圣藤澤秀行九段
“AlphaGo就像是好萊塢影片《侏羅紀世界》里,人類暗中研究培育的那頭變異暴龍。”–上海知名圍棋教練夏勝浩
“職業棋手已經接受競技角度上,AI超越人類的現實。但從思維方式上,AlphaGo會對棋手有更多幫助,局部方面的對抗,大局觀的把控。”–上海棋院副院長劉世振
“人機大戰的勝利者依舊是人類,人類制造了AlphaGo,這次比賽預估也將讓歐美的圍棋普及度增加5倍。”–韓國棋院院長洪錫炫
“世界上真正的挑戰不是’人類對機器’,而是人類利用機器與那些全球性難題之間的對決。’阿爾法圍棋’對人工智能的發展和人類的發展都是積極的一步,今后它的水平還可能應用到醫療等其他領域,更好地造福人類。”–谷歌CEO桑達-皮查
“這絕不是圍棋的終點,而是一個新的起點!我們正處在最好的時代,一個激動人心的科技發展的時代。人工智能、機器人、深度學習、VR虛擬現實這些將代表未來科技發展方向的事物我們都還在探索,云和數據現在正在主攻VR虛擬現實領域。”——云和數據CEO郭凱
網友吐槽:
看了前三局本來想給孩子報個圍棋班呢,第四局看完,得,還是給送到云和學院學編程吧!–云和小編阿凡
我估摸著把李世石拆了,會發現有個阿爾法狗beta版本趴在里面–云和數據某程序員一
李世石連輸5局氣急敗壞地砸開電腦,發現柯潔趴在機箱里–云和數據某程序員二
啊~啊~啊~九段,你比八段多一段;啊~啊~啊~九段,你比十段少一段;終于有一天,阿法狗來挑戰,連輸三盤怎么辦,只好拔插線板~要是再輸怎么辦,要么麻將來兩盤~–麻將哥哥
我腳得,大殺器是這樣的:下著下著,李世石從棋盤上拿起一粒棋子,”啪”的一聲拍在棋盤另一個位置,大喊一聲”將軍”,然后,阿法狗就當機了…–象棋弟弟
我去都3.15了啊,阿爾法狗的產品質量問題有沒有人能關注下?–打假達人
“我叫李世石,我是一名來自韓國的棋手,今天早上出門前我在網上各大投注點用盡家財下了巨額賭注買我自己輸,我想,這就是人類比人工智能強的地方。”–某直播員