AlphaGo真的理解围棋吗?

我非常认可这样一段话:你或许还是不能接受AlphaGo这个样子,我想这是因为,人们下围棋,一定要先理解“围棋”什么东西,下面才可以操作。但是AlphaGo却是在不知道(或者没有被提供数据)“围棋是一种2个人的,而且两个人面对面做的,对抗的,零和的,棋盘19*19的,棋盘是方的,上面是打格子的,格子也是方的,有黑白两个子的,黑子先下的,两个轮流下的,要下在格点而不是格子中间的,有限时要求的,棋子数量足够的,一个棋子不会占超过一格的,棋子是圆的,两边凸起的,中国古代发明的,一种博弈游戏”中的任何一点的时候,可以战胜人类。

首先,我认为AlphaGo是可以理解围棋的。

计算机对围棋有这样的规定(Tromp-Taylor规则定义),围棋是一个在19*19格点上进行,两个玩家“小黑”、“小白”,轮流分别把棋盘上的某一个格点染成黑色或白色的游戏。再加上提子和禁循环的规则,以及终局判断,就是完整的Tromp-Taylor规则。这样的围棋,和我们眼中的围棋,有什么本质区别吗?如果不考虑围棋文化,那么我可以肯定地说,没有区别。

那么为什么AlphaGo会引起如此大的关注度,有人还说人类最后一块阵地失守,甚至还有人说人工智能将会取代人类。答:围棋是世界上最复杂的游戏之一。所谓“一着不慎,满盘皆输”,每一步棋都可能左右全局的结果。一般来说,一手棋的决策分两步。第一步,“选点”:凭经验或感觉给出几个候选的点;第二步,“判断”:分别对这几个点做形式判断,并进行比较。这两步,说来容易,但要做到顶尖高手的水平,对于天赋和勤勉的要求,不亚于一个优秀数学家所需要的。

阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由谷歌(Google)旗下DeepMind公司的戴密斯·哈萨比斯、大卫·席尔瓦、黄士杰与他们的团队开发。其主要工作原理是“深度学习”。

那么何为“深度学习”?深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务(例如,人脸识别或面部表情识别)。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。同机器学习方法一样,深度机器学习方法也有监督学习与无监督学习之分.不同的学习框架下建立的学习模型很是不同.例如,卷积神经网络(Convolutionalneuralnetworks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(DeepBeliefNets,简称DBNs)就是一种无监督学习下的机器学习模型。

正是因为这种“深度学习”才让了AlphaGo学习到了博大精深的围棋,正是因为“深度学习”让AlphaGo从对围棋的无知到挑战世界顶尖棋手。

那么,人又是为何会下围棋的呢?

人在下棋的时候,每一个下棋步骤的决定也都是通过了类似的信号加减。我们对现在的棋盘状态有个价值判断,胜败概率判断。下棋在不同的格子,这种选择,也是通过经验;对不同的格子就有不同的胜败概率涨跌估算。同时我们也会通过经验来预测对方下面几个回合的走棋步骤。专家的经验多了,对这三个方面的价值判断能力也就更清晰了。

一开始接触围棋,对这些东西都没啥预测能力,或者非常不准,因为根本没有机会经历类似的情况;一切都是新的状态。一步一步熟悉起来了,会保留更多的状态记忆。会想起以前经历过的。这才进一步准确判断不同选择的价值。再专业的那些人,他们不用刻意去想,已经成了下意识。思维已经跑到了上层建筑、还有上上层。什么时候走错或者不知道怎么走,都是因为某个层面还缺乏概念,或者还没经历过这个情况,无法认识到pattern。阿法狗也是通过类似的学习方式一步一步修建自己的判断能力准确度。神经网络里面的权重,对应的就是人类所学到的那些“规则”。他的规则层次,最后选择也都是有原因,有经验的,一样也是“理解”。跟人类的理解没差多少。