電腦有望在圍棋上戰(zhàn)勝人類
來源:站長新聞AiWeTalk的空間 2014-12-17
IBM的深藍曾經(jīng)戰(zhàn)勝國際象棋高手,讓我們感嘆計算機技術(shù)的進步。不過,多年以來,古老的圍棋卻成為計算機難以把握的難題。如今,借助于神經(jīng)網(wǎng)絡(luò)的進步,計算機專家們試圖突破傳統(tǒng)算法,以全新的方式訓(xùn)練計算機的下棋能力。據(jù)technology review的報道,來自愛丁堡大學的計算機專家Christopher Clark 和Amos Storkey 在這方面取得了不小的進步。
專家們認為,計算機難以掌握圍棋的原因有兩個:一是,在下圍棋的時候,棋手總是面臨太多的選擇。在任意時刻,棋手面臨的選擇多達上百種。相比較說,國際象棋中,棋手面對的選擇大約是50 種。二是,計算機很難評估雙方的優(yōu)勢和弱勢。在國際象棋中,通過評估剩下棋子的價值,計算機通常能夠了解玩家是否處于優(yōu)勢地位,但是,在圍棋中,計算機很難對此做出評估!坝嬎忝總玩家的棋子數(shù)量,根本無法判斷誰在取勝。” Clark 和Storkey 說。
為了解決這個問題,計算機采取了一種特別的方法。在每一步之后,計算機都會玩完整個游戲,而且采取各種不同的方法。如果大多數(shù)情況下都是勝利的,計算機會認為,它走出的一步是正確的。這是一個非常耗時的任務(wù),而且,計算機通常還是失敗。因為圍棋高手只要看一眼,就能判斷出棋盤上的形勢如何。
一些專家認為,人類擅長圍棋的秘密在于模式辨識能力。在下圍棋的時候,人類思考的不是前面的幾步,而是根據(jù)棋子組成的形狀,判斷出雙方的優(yōu)勢和劣勢。因此,隨著模式識別算法方面的進步,人們開始思考訓(xùn)練計算機的新方法。
Clark 和Storkey 訓(xùn)練了一個復(fù)雜的神經(jīng)網(wǎng)絡(luò),教它預(yù)測下一步是什么。他們從16 萬次的圍棋高手對戰(zhàn)中,生成1650 萬個棋局,然后,他們訓(xùn)練神經(jīng)網(wǎng)絡(luò),讓它掌握人類高手的下一步動作。許多天后,他們開始用剩下的棋局測試神經(jīng)網(wǎng)絡(luò),讓它預(yù)測下一步應(yīng)該怎么走。據(jù)兩個人說,在訓(xùn)練之后,神經(jīng)網(wǎng)絡(luò)預(yù)測的準確率明顯超過以前算法,大約提升了44%。
在訓(xùn)練完神經(jīng)網(wǎng)絡(luò)之后,Clark 和Storkey 讓它與兩個最好的圍棋算法比賽。其中一個是GNU Go,相當于中等水平的業(yè)余選手。在與GNU Go 的對戰(zhàn)中,神經(jīng)網(wǎng)絡(luò)明顯勝出,大概90% 的情況都是取勝的。另外一個是Fuego,比GNU Go 的水平更高,人類選手也要多年訓(xùn)練才能達到這個等級。在與Fuego 的對戰(zhàn)中,神經(jīng)網(wǎng)絡(luò)只贏了10% 的比賽。不過,Clark 和Storkey 認為,這已經(jīng)是很大的進步了。
“盡管神經(jīng)網(wǎng)絡(luò)下棋時采用了‘不看下一步’的做法,并且只用了對手的部分計算時間,它仍然比GNU Go 玩的更好,而且還贏了Fuego 幾局! Clark 和Storkey 說。同時,他們也認為,如果把神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的算法結(jié)合,計算機的圍棋技能或許會有更大的進步。
文章編輯: AiWeTalk網(wǎng)頁客服(reidrightsolutions.com)
我的評論
登錄賬號: | 密碼: | 快速注冊 | 找回密碼 |