相对于计算机在国际象棋中的胜利,中国象棋的智能程序进展一直落后。
这倒不是中国象棋要比国际象棋难之类的原因,而是因为棋类智能对于大公司来说毕竟只是一种公关手段,没有实际上的营收价值。
“深蓝”取得国际象棋的胜利之后,许多人都认为计算机下棋这事已经差不多到头了,
继续去搞难度差不多的中国象棋费力不讨好,IBM也解散了“深蓝”团队。
唯有围棋确实难度上要高很多,并且很具有挑战性。
一般人们都认为,计算机要在围棋中取胜比在国际象棋等游戏中取胜要困难得多,因为围棋的棋盘太大,下棋点极多,分支因子远多于其他游戏。
并且每次落子对情势的好坏飘忽不定,天堂地狱就在一瞬之间,技术很成熟之后,人们经常可以观察到那种一手棋下掉AI系统百分之六七十胜率的情况。
可以说是“一着不慎满盘皆输”的最好演绎了。
诸如暴力搜索法、Alpha-beta剪枝、启发式搜索的传统人工智能方法在围棋中很难奏效。
不过围棋在西方没什么受众,主要热度还是在东亚三国,因此很长一段时间内没有太多人愿意花时间在这件事情上,这十几年的发展速度中规中矩。
DeepMind投入在这件事情上,很大程度也是机缘巧合。
一方面许多高层都热爱棋类,另一方面可能更加关键,DeepMind的核心成员,两位首席科学家之一的黄士杰在围棋智能上有着很深的积淀和情怀。
黄士杰的硕士论文是《计算机围棋的打劫策略》,博士论文是《应用于电脑围棋之蒙地卡罗树搜寻法的新启发式演算法》。
相比孟繁岐这种毕业了连本科专业知识都全忘了的人,黄博士可以说专业是非常对口了。
“其实现在的围棋智能已经有了一定的竞争力。”黄博士为孟繁岐介绍了一下现阶段围棋智能的棋力:“差不多最高才在业余五段左右的水平,如果不让字的话,和真正的职业选手对弈,毫无胜算。”
基本的围棋棋力划分孟繁岐还是大概清楚的,业余六段大约可以与职业初段水平相比拟。
黄士杰博士本人就是宝岛业余六段,算得上是职业水准守门员了。
倘若自己造出的智能程式能够稳定占据上风,自己完全下不过的话,基本上象征着围棋智能来到了真的职业水准。
而不是只能通过让3-4子这样的方式击败职业棋手。
并且,如果造出来的智能下不过自己,这件事情属实没什么意思。
“你们目前的想法和策略大概是什么样的。”大概聊了一些情况之后,孟繁岐将话题切入了具体的算法部分。
从理论上来说,围棋问题的输入和孟繁岐非常擅长的图像类其实很像。
彩色图片在计算机中的形式就是多通道矩阵,通常为3通道,代表三原色。
比如,一张分辨率为224x224的图片,就是以三个[224, 224]矩阵的形式进行存储。
一般来说,每个位置的取值在0255之间。
对于围棋这个情况来说,它的输入就像是一个19x19的单通道图片。
19x19表示棋盘上所有的落子地点,而每个地点的取值就只有三种状态,黑,白,无子。
可以用[-1,0,1]三个数字来指代。
而围棋智能的目标,所谓的下棋。