天才棋士_第121章（2 / 3）

投票推荐加入书签留言反馈

按照传统，计算机的长处应该在计算。而围棋，恰恰是不可能被暴力计算的领域。围棋的很多概念都无法被量化，厚薄、争先、取势……这种东西，电脑怎么去理解？！谢榆的本职是个码农，虽然不务正业，但凭他对计算机和围棋两个领域的了解，他曾经尝试过围棋ai的编码，所以他非常清楚这些概念是无法被量化的。此前出现的ai也一直印证着他的猜想，直到alphago。

他敢肯定，alphago的计算方式产生了相当大的变化！alphago不是以计算机的惯性在运行，它完全是人脑的思维方式！

“他们在蒙特卡洛树搜索上加装了什么？”谢榆一目十行地扫过屏幕上的代码。

蒙特卡洛树搜索，是围棋ai的基本解决框架。围棋ai每一步都选择若干种落子，然后在电脑中模拟到终局，进行数子，最终选择胜率最高的那一步棋。因为计算量太大，ai只能给出一个近似最优解，并非全枚举，在alphago之前ai因此也只能达到业余五级的水准。

这依旧是一个计算的范畴，而职业棋士很多时候并不是单靠计算做出判断，像之前所说的全局观念，就是蒙特卡洛树搜索无法解决的问题。要让ai发挥出人脑的效果，到底靠的什么？

当天晚上，谢榆从美国的某个计算机大牛那里，获知了他想要的答案。

alphago团队在蒙特卡洛树搜索上加装了策略网络和价值网络两个模块。

这两个模块让alphago不是单纯地计算，而是深度学习、模仿人类！

策略网络，顾名思义是决策下一步走子。alphago会检索kcs围棋服务器上所有真人在线对弈，进而判断：如果是人类棋手处于它当前的位置，他最有可能走哪一步？它只对那些解进行计算！然后，它就自我对弈上千万局，看看这一步是否真的是最优解！

遵循策略网络，蒙特卡洛树搜索的树宽将大量减少，但深度依旧存在。上千万局博弈，每一局都走到最后，依旧是可怕的计算量。

计算深度的减少用上了价值网络。它以alphago产生的大量自我博弈作为样本，检索这种棋形在历史上的胜率，把好坏、优劣变成了一个概率问题！那么每一回，alphago计算到一定深度就可以停下来，直接估算当前胜率！

经验的本质是概率，从本质上来说，以概率判断局面的alphago，就是以“经验判断现状”的人类大脑运行模式！alphago的走子，也完全遵循了人类棋手的思维历程——大量背谱，吸取经验，自我思考，判断局势……然后估算其后若干步的棋局导向！

只是这个棋手，等于千百年来千千万万个棋手的经验总和，并且，完全不会出错罢了。

第二天，乌镇再传出消息：魏柯第二局，依旧惨败！

魏柯意识到细棋是没有机会的，一开始就主动展开攻势，趁着布局阶段想要对alphago进行压制。他意识到alphago非常有经验，尝试用怪着、偏着对付他，导致子效低下，输得比昨天更惨！王梦雨甚至在解说时失声痛哭，即使他根本不是魏柯，也无法承受这种绝望的差距，可想而知魏柯所肩负的压力。
↑返回顶部↑

天才棋士所有内容均来自互联网，久文学只为原作者o白野o的小说进行宣传。欢迎各位书友支持o白野o并收藏天才棋士最新章节。