【AI】围棋AI给出的手段，难道就是正解吗？-腾讯围棋

【AI】围棋AI给出的手段，难道就是正解吗？

原址：https://www.nihonkiin.or.jp/etc/go_weekly/tsururin083.html

原题：AIの手は正解なのか～大橋拓文七段と考えるAIとの付き合い方「つるりん式観る碁のすすめ～こぼれ話」

摘自：日本棋院

作者：编辑K

翻译和整理：找借口安静这篇比较长就翻了

这一次我们请了学术类钢琴家（？），被誉为是太空人的大桥拓文七段。大桥拓文的钢琴水平应该是棋界第一人。然后对围棋AI方面有着非常广泛的知识，经常下出一些AI手段的同时，还研究AI是不是有极限，AI认为的最强手段是怎么定义的，从科学和哲学领域对其进行研究。

当今AI已经成为了触手可及的工具，想到AI就想到能给我们准确的下法。将实力的基准提升到了和AI的吻合度。但是AI真的是正确的吗？难道提升和AI的吻合度才能是接近最好手段的方式吗？

在这个专栏中，我们直接把这些问题抛给大桥拓文，对AI的现状进行探究。AI实力强劲，并且能看到绝对的结论。而AI给我们显示的手段，是不是我们想到的神之一手呢？我们借此来了解一下深奥的AI世界的冰山一角。

——大桥拓文七段今天请多关照。

大桥拓文：请多关照。

——长话短说我们想针对AI进行采访，AlphaGo出现至今已有7年多，AI现在已经成为了我们触手可及的东西。现在棋手们用AI进行研究已经是常态，在直播中用AI胜率值进行表示，还用AI显示出当前局面的推荐手段。拿自己来说，我在看棋的时候也会下意识地把AI给出的手段当作是“正解”，实际上你觉得AI给出的手段就真的是“正解”吗？

大桥拓文：这个确实很复杂，首先我们要对“正解”进行定义。多数情况下，下出比人类更加精准，并且能赢棋的手段，我觉得比较接近于“正解”的。

——也就是说这不是“正解”，应该是属于“最佳”。那你觉得AI给出的手段是“最佳”手段吗？

大桥拓文：我们先不谈人类怎么接受这些下法，首先AI是没有“最佳”的概念的。在这种情况下来评判“最佳”，是不是觉得是一件很困难的事情呢？比如说用最短的手数赢棋，还是赢最多的目数，你觉得哪一个才是“最佳”呢？

——这么说还挺有道理的，这两个角度其实都可以认为是“最佳”。

大桥拓文：刚刚我也提到了AI没有“最佳”的概念，但是AI在选择每一手棋的之后，都有着
“获胜”的目标。然后如何设定“获胜”的方式，就取决于各个AI的个性了。实际上这都是由设计程序的人类设计而反映出的结果。

——这是什么原因呢？

大桥拓文：比如说，AlphaGo把最终的目标定在“赢棋”，然后选择避开高风险的手段，选择了赢半目的下法。所以就会选择一些人类看上去可能会亏损的手段，但是AI依旧会选择安全的下法。后来就出现了从“以更大的目数获胜”的AI。这就和“哥伦布的鸡蛋”一样，因为追求更大的目数的AI比追求仅仅“赢”的AI更强大，但并不一定需要刻意去制作一个追求更大目数的AI。总之相较于AlphaGo时代的AI，现在的AI越来越倾向于选择高风险高回报。

——棋风和人类一样很有意思。

大桥拓文：进一步来说，现在还出现了在布局阶段，通过对手的手段来推测实力。一旦判断“棋力较低”之后AI就会选择比较收手的手段的AI。当然这也是因为当初程序是这么设计的，所以看上去才会那样，实际上被下套的人就觉得自己就和漫画《棋魂》中的棋会所的那个大叔一样，感觉任何下法都被他看透了。

——确实有这种感觉，就觉得AI是富有人格的。

大桥拓文：我也有这种感觉，但是后来冷静地告诉自己，这些都是通过计算得到的结果（笑）。

——我们换一个话题，有的棋手说：“因为AI自己手段的范围变广了”，也有说“自己的手段变窄了”。而你又是怎么感觉的呢？

大桥拓文：从长远角度出发是变广了，但是目前处在过渡期，确实有些人会觉得范围变窄了。

——这是什么原因呢？

大桥拓文：AI会通过自我对局来提升自己的水平。比如我你和相同棋力、相同棋风的人一直下几千或者几万盘，你觉得会不会涨棋呢？

——难道不会变强吗？

大桥拓文：你觉得你和棋风一样的人一直下棋，实力会变强吗？

——我明白了。确实如果和棋风相同的人一直对局，那只会反复下一样的布局。到后来只擅长某一个布局，但是其他手段的话可能并非如此了。

大桥拓文：就是这个道理。通过电脑进行自我对局，重复进行几万盘相同的事情。说实话我们也不知道他是不是聪明（笑）。不过像AlphaGo Zero那样开发这一类AI的话，让电脑自我进行自我对局的操作也非常重要。不过开发下围棋很强的AI的话，现阶段还是需要通过人类的设置，才能扩大研究的范围。这些其实从KataGo的官方网站就能有所了解。实际上现在的围棋AI的布局套路也变得越来越多。

——我看AI经常点三三，这或许可能不是因为这是好棋才这么下，而是因为这手棋经常出现，所以AI也这么下了。如果AI今后变得更强的话，今后的AI定式有可能会和现在完全不一样，布局也有可能变得多样化。

大桥拓文：就是这个道理，还有就是和现在相关的话题，那就是我想强调AI“不会像人类一样有认知，也不会有理解能力”。你应该还记得，AlphaGo刚出现的时候，很不擅长征子和大头鬼。

——是的，明明这么强，竟然不认识征子。

大桥拓文：现在的AI通过人类的设置，把AI不擅长的棋型程序化了，所以现在他们也知道什么是征子了，有的人可能会觉得，这么简单的事情还需要通过设置来解决挺不可思议的。为什么会出现这种情况呢？那就是AI不知道征子，也不会理解什么是征子。其实不仅是征子，其实连两眼做活，AI也都是一知半解的。

——详细说说。

大桥拓文：人类会通过伦理来考虑手段，通过棋型来识别征子的棋型。这样理所当然的事情其实AI是做不到的。与其说做不到，AI在这方面的思维方式就不一样。围棋AI会把自己摸索的范围作为自己的世界，但是自己摸索不到的地方它们是不知道的。简单来说的话，比如说有一个手数很长的征子，人类的话只要知道征子的棋型，哪怕是100手的征子也是可以下完并且吃掉的。但是AI就没有“重复做这个动作”的想法，每一手棋都需要摸索，所以在计算100手的征子时，他们计算到50手就有可能算不下去了。

前段时间出现了只要找到AI的弱点，人类就能战胜围棋AI的事情成为了话题。实际上AI连死活的改变也没有。为了让AI产生错觉，让AI把自己的棋走成一个环，这样的话AI就会觉得即便只有一只眼也能活棋。以前AI就有只要不会被拔起来的棋，AI就有可能将其认为是活棋的错觉。但是只要让AI的棋围成一圈，AI就完全被我们套路的事情。在这方面相较于棋手，很多职业游戏玩家比我们更厉害（笑）。并且人类只要有10级左右的棋力，就能轻轻松松识破这个弱点。人类至少知道两眼活棋或者双活的概念，但是对AI来说，我觉得他们对两眼活棋的概念应该还是一知半解的。

——能轻轻松松战胜顶尖棋手的围棋AI，竟然没有“认知”和“理解”的概念还是很意外的。

大桥拓文：真的是这样，问题是从AI获得手段的人类，可能一直会觉得这是AI的认知或者是理解。对AI来说，他们学习的世界可能会比人类做得更好，但是在他们没有学习到的世界，很多人类可以轻轻松松做到的事情，AI有时候可能就做不到。所以我们要理解AI的基础上，如何和AI共同相处才是非常重要的。

——不把AI一切当成绝对的结果是很重要的事情。最后还想问的一个问题是，我们今后如何和AI共同相处下去呢？

大桥拓文：我们每天都和各种AI进行对局，现在围棋AI的实力面对人类棋手是碾压式的强大。我的话至少要受让30目才行。在扑朔迷离的局面下，AI的形势判断也很准确，包括需要计算的中盘对攻，虽然在这种情况下可能比形势判断要稍微逊色一些，不过很多时候还是比人类棋手要强。利用AI进行学习是非常有用的事情，还有可能会扩大围棋的可能性。不过很多时候觉得AI给出的手段很容易被认为是正解，其实很多手段有可能是错误的，即便是正确的，我们可能也很难下出最好的下法。也就是说AI给出的手段对我们来说是不是好棋，这是我们需要判断也是需要我们好好学习的地方。

——现在的AI技术，在围棋以外的领域正逐步开始变得实用化。这一次提到的和围棋AI的相处方式，今后在身边可能会有更多的AI出现，在这种情况下我们该如何相处，这一次确实是学到了很多东西。今天非常感谢接受采访。