元霄畫出一個概念圖:“第一個我們需要的是,可以稱為策略神經網路。”
策略神經網路的作用,是判斷當前局勢下,下一步棋下在哪裡最合適。
元霄認為,這裡的選點,可以參考人類棋手的棋譜。
模仿人類棋手的思考模式,快速將一些低機率的點淘汰掉。
柯傑嘆了口氣:“看來,到時候我還要提供目前為止所有人類的對局棋譜了。”
理論上而言,棋譜數量越多,策略神經網路的成熟度也越高。
“這一點,我們讓計算機自主學習。”元霄指出其中的關鍵。
反覆推演學習的結果,將會使策略神經網路更加強大,選點更為準確。
“而要做到這一步,還需要另外一個神經網路的結合。”元霄寫下一個公式。
價值神經網路。
其作用是能夠計算出,每個選點的勝率。
每一步都進行這樣的估值判斷,直到棋局的結束,得到最精準的勝率數值。
而同樣,這東西也可以自己學習。
總結起來其實很簡單。
就是模擬人類下棋的思維。
首先判斷在哪些地方可以下,每個地方的勝率是多少。
然後對這些選點進行集中計算,推演出最後的結果。
每一步都這麼執行。
那麼得到的每一手,自然就是最佳的下法。
如果說一開始柯傑覺得元霄說的是天方夜譚。
到了現在,他感覺這東西並不是完全不可能實現的了。
他嚥下口水:“如此一來的話,那不是一開始的時候,計算機就已經鎖定了結果。”
必勝的結果。
►傲世指數+8888
“這只是大概的概念,實際我們還需要一步步來,”元霄放下筆,“柯院長,到時候和圍棋軟體的對弈,還需要你來。”
柯傑表示責無旁貸。
蘇辰逸、卓越、方旭堯幾個都聽懂了。
夏晚晴黎沐嵐之流,當然是不知所云。
尤其是夏晚晴,她表示很鄙視。
花腦袋去開發這玩意有啥用。
老師也真是的,有時間和我一起不香麼。
計算機的世界,果然蘊含宅的屬性。