立場新聞 Stand News

人機對奕,談何不公?

2016/3/15 — 12:28

人機大戰第五局直播截圖

人機大戰第五局直播截圖

【文:劉漢森】

關於人工智慧圍棋系統「AlphaGo」和全球棋王李世乭(Lee Se-Dol)的圍棋對弈,華文世界不少專家已作精闢解說。筆者推介尹相志的《淺談Alpha Go所涉及的深度學習技術》。[1] 本文旨在回應其他報道中,南韓資訊通信專業律師田石鎮就人機對奕不公的批評。[2]

廣告

在報道中,田石鎮律師的批評主要有兩點:

1)對賽用的是分散版,透過網絡連結。田石鎮律師認為,「AlphaGo在這場對弈之中可以透過網路隨時收集資訊,在李世乭落子後進行運算後予以應對」,造成不公。

廣告

2)田石鎮律師認為「AlphaGo 甚至動用窮舉法(BF演算法—Brute Force,對未來可能發生的所有情況進行分析)下棋」,違反規則。

先回應第二點。在回應之前,先讓我們看看《棋魂》漫畫版第116回,塔矢行洋對佐為一局,塔矢行洋在投降之前的一番對白:「只餘下小官子,看清楚到終局的棋路。我將會……輸掉半目。官子與之前攻防方式不同,只得一條棋路,程序很複雜,容易出錯,不過……正確的道路只得一條。此人肯定跟我一樣,已看到終局的盤面。」 [3]

根據圍棋規則(虛手終局,地大為勝),如雙方均同意無子可下,即可按規則判定勝負。那麼雙方如何判定「無子可下」?先不論由人腦還是由電腦博奕,雙方在此「對未來可能發生的所有情況進行分析」是否為過?若然在這情況下,窮舉不算「違反規則」,那麼雙方於之前多少步採用窮舉法才算「違反規則」?正如先前所引的漫畫劇情,在小官子(進入終盤的最終階段),雙方已預見終局盤面,用窮舉法何足為過?

Google方面主張AlphaGo 是採用經深度學習的類神經網絡來決定下一手。類神經網絡並不會有由人類輸入,明確的判斷規則。有的只是從「指教」中歸納出來的最佳運算程序,需研究人員事後分析才能得知這個人工智能的判斷基準。以類神經網絡的龐大運算量,到棋局的某個狀態,人工智能的運算量覆蓋窮舉法亦不足為奇。有否演變成窮舉法,仍需事後分析。

筆者初學圍棋時,曾有不切實際的幻想,如能製作一個表格,左方是所有對局的狀態,右方是最佳應對,則任何人手持這個表格,便能輕鬆獲勝。現實是,即使對局狀態有限,窮盡宇宙所有物質和時間,也不能完成這個表格,技術上只能做出即場有用的極小部分。任何「人」對奕,不管雙方有或沒有這個萬用對應表,手持還是心算,談得上公平的只有「思考」時間限制,各方在限時內運用最有效率的方法獲得最好的應對,而非限制任何人用任何方法計算應有的對應。有否窮舉,無關痛癢。

再回應第一點。回應之前,先看看筆者昨日和筆者學生們的對話。(對話是在國際數學建模挑戰賽的賽前訓練中進行)

學生:AlphaGo可以上網,並不公平。

筆者:那麼你們認為人工智能一方可以用一台多大的機器?

(學生出示考評局核准的電子計算機)

筆者:(指向普通中學課室的桌面電腦)這台不行嗎?(學生猶豫)這間課室般大的機器不行嗎?

學生:有點過分吧。

筆者:(左手拇指食指作正方形狀)一顆這麼大的電腦中央處理器可以嗎?

學生:當然可以。

筆者:兩顆可以嗎?

學生:可以。

筆者:那用甚麼來連結?

學生:電線。

筆者:有沒有長度限制?(學生無言)第二顆可以放在隔壁班房嗎?(學生無言)那四顆可以嗎?既然多少顆都可以,為何透過網絡連結不行?

「人」「人」對奕,「為保公平」,的確不容第三者用任何方式介入,包括在現場或用通訊器材通風報信。這裡「人」的定義相對明確,頭﹑軀幹﹑四肢「及其連結」。誰是第三者,誰人通風報信,一目了然。可是,「一台機器」的定義卻不甚明確。執拗於連結各部分間的電線種類,未免無理取鬧。田石鎮律師或許擔心第三者能在場外介入 AlphaGo 的運算,未有實質證據之前,不應妄下判斷。

與其質問有否透過網路隨時收集資訊,不如質疑AlphaGo 在指教過程中是否已利用透過任何方法收集,而田石鎮律師認為不公的資料。可是,對局前仔細研究對手,與其評之為不公,不如認之為常識。

上星期從報道得悉田石鎮律師的批評,筆者從棋藝界朋友的反應中得知,他的批評在某些棋界朋友相當受落。自從各方專家深入淺出地解說 AlphaGo 的運作原理後,部分棋界朋友的誤解業已消除。

筆者亦希望略盡綿力,澄清各方對是次人機大戰的誤解。

 

參考資料:

[1] 尹相志《淺談Alpha Go所涉及的深度學習技術》 

[2] 南韓專家:AlphaGo可拆解李世乭棋招 《自由時報》11-3-2016

[3] 《棋魂》單行本 第14期

作者簡介:中學數學教師,亦是國際數學建模挑戰賽2015其中一隊香港得獎隊伍的指導教師

發表意見