關燈 巨大 直達底部
親,雙擊螢幕即可自動滾動
第180章 圍棋軟體的工作原理

元霄畫出一個概念圖:“第一個我們需要的是,可以稱為策略神經網路。”

策略神經網路的作用,是判斷當前局勢下,下一步棋下在哪裡最合適。

元霄認為,這裡的選點,可以參考人類棋手的棋譜。

模仿人類棋手的思考模式,快速將一些低機率的點淘汰掉。

柯傑嘆了口氣:“看來,到時候我還要提供目前為止所有人類的對局棋譜了。”

理論上而言,棋譜數量越多,策略神經網路的成熟度也越高。

“這一點,我們讓計算機自主學習。”元霄指出其中的關鍵。

反覆推演學習的結果,將會使策略神經網路更加強大,選點更為準確。

“而要做到這一步,還需要另外一個神經網路的結合。”元霄寫下一個公式。

價值神經網路。

其作用是能夠計算出,每個選點的勝率。

每一步都進行這樣的估值判斷,直到棋局的結束,得到最精準的勝率數值。

而同樣,這東西也可以自己學習。

總結起來其實很簡單。

就是模擬人類下棋的思維。

首先判斷在哪些地方可以下,每個地方的勝率是多少。

然後對這些選點進行集中計算,推演出最後的結果。

每一步都這麼執行。

那麼得到的每一手,自然就是最佳的下法。

如果說一開始柯傑覺得元霄說的是天方夜譚。

到了現在,他感覺這東西並不是完全不可能實現的了。

他嚥下口水:“如此一來的話,那不是一開始的時候,計算機就已經鎖定了結果。”

必勝的結果。

►傲世指數+8888

“這只是大概的概念,實際我們還需要一步步來,”元霄放下筆,“柯院長,到時候和圍棋軟體的對弈,還需要你來。”

柯傑表示責無旁貸。

蘇辰逸、卓越、方旭堯幾個都聽懂了。

夏晚晴黎沐嵐之流,當然是不知所云。

尤其是夏晚晴,她表示很鄙視。

花腦袋去開發這玩意有啥用。

老師也真是的,有時間和我一起不香麼。

計算機的世界,果然蘊含宅的屬性。