立場新聞 Stand News

【電腦棋魂】Google人工智能 大勝圍棋棋王

2016/1/28 — 15:40

去年十月,人腦再次輸給電腦。Google DeepMind 研發的 Alpha Go 成功以五比零擊敗歐洲棋王,終打破人類不敗紀錄,成為「電腦棋靈王」。

人類自 1990 年起,就不斷在下棋遊戲中敗給人工智能,除了一項 — 圍棋。圍棋比起其他棋類遊戲更為複雜,要在 19 x 19 的棋盤上佔領最多地盤才可以得勝。以往電腦一直都未能在這個只有黑白棋子的遊戲中擊敗人類,原因是當中牽涉到不只是一套邏輯規則,而是一套多變的「模式」。平均一場圍棋大概要走 150 步,即是有 10170  個組合。所以對於一般的人工智能程式而言,實在一點都不容易。

要解決這個問題, DeepMind 的研究人員就在名為  Alpha Go 的人工智能程式是「安裝」了深度神經網絡 (Deep Neural Network) 和搜尋技術 (Search Technique) 組合。他們應用了兩個類似人腦神經的 13 層深度網絡。但空有深度神經網絡並不足夠,為了訓練它們,他們上載了圍棋專家超過 3,000 萬步的棋步到其中一個網絡,以令系統可以學習到致勝之道。另外 ,他們也按排 AlphaGo 自行模擬比賽,一來可以更熟悉遊戲本身,又可以發掘一些新的策略。

廣告

除此之外,要找出走下一步棋的最住方法,一般就要逐步嘗試——這樣做的話會浪費不少處理時間。 DeepMind 的研究人員就引用了一種名為 Monte Carlo Tree Search 的方法。該統計方法令  DeepMind 在最短時間找出下一步,免去逐一運算的時間。研究人員相信兩種技術可以令電腦識別到下圍棋的模式,又可以在短時間內找出最有機會蠃出的方法,所以令程式不僅可以贏到其他  A.I. 程式 (勝率達 99.8%),更可以直落五場擊敗歐洲棋王樊麾 (Fan Hui) 。

廣告

以為 AlphaGo 的發展的目的就只有下棋?現年 39 歲的 DeepMind 創辦人 Demis Hassabis 相信,AlphaGo 的重要性不只是在於「蠃出圍棋賽」,而是將這類人工智能技術到現實生活。他認為,如果電腦深度學習的能力在將來繼續提升,或有望可以幫助科學家建設一個更有效的氣候電腦模型,又或者用作疾病分析等。

這次研發 AlphaGo 的公司 DeepMind 是一個英國初創公司,在 2010 年成立,早年的投資者包括有最近訪港的 Tesla 創辦人 Elon Musk 和 Skype 工程師 Jaan Tallinn。 DeepMind  的成功更吸引了不少科技公司巨頭的注意,最終在 2014 年,他們成功以 50 億港元將公司出售予 Google,而當年其中一個賣家更是香港首富李嘉誠。

真正的挑戰還未結束,AlphaGo 下次將會挑戰世界棋王之一,南韓棋手李世石。阿爾伯塔大學電電腦科學教授 Jonathan Schaeffer 和 Amazon 軟件工程師 David Fotland 均認為 李世石仍有機會勝出,但一定會是一場苦戰。當然 Hassabis 就相當有信心 AlphaGo 可以擊敗他。要知道究竟到時鹿死誰手,就要留待三月的比賽。 

相關文章:

天價智能 文/丘亦生

原文:
Nature, Google AI algorithm masters ancient game of Go, 27 January 2016

文/eh

發表意見