最近几年,世界围棋界迎来了黑暗的时刻,都是因为这个alpha go。
首先围棋世界冠军九段李世石以1:4败给阿尔法go,但总之赢了一场。 在这个时候,人们只能感觉到AI围棋机器人很厉害,能够战胜人类的顶尖选手。
后来被称为围棋第一人的科杰0:3败给了阿尔法go,这时人类才发现阿尔法go没有胜利的迹象。
李世石在输给阿尔法go后,宣布今年退役,阿尔法go认为无法取胜,很多围棋选手感到沮丧。 科杰坦率地说,在阿尔法go面前,人类棋手显得有些多馀。 现在阿尔法go的自学速度越来越快,人类想赢阿尔法go的想法越来越不可能了。
那么,为什么小型围棋机器人仅仅几个月就能超越人类几千年的围棋经验站在不败之地呢? 人类应该怎么想呢?
阿尔法go的起源
说到阿尔法go的起源,Deep Mind和Deep Blue不得不说。
深蓝是IBM发明的人工智能系统,活跃于1990年代,在国际象棋比赛中赢得了世界冠军。 但任务特定,用途单一,属于狭义的人工智能( Narrow AI )。
Deep Mind是由Demis Hassabis创立的专注于人工智能的公司,该公司是人工智能的专家,也是神经学的专家,他将机器的自我学习与网络的神经学习相结合,创造了一种非常强大的学习算法
alpha go为什么要在围棋界战斗
围棋的起源是中国,有着3000年的悠久历史,我们古人常说的“琴棋书画”的象棋是围棋,也被称为对战、游戏。 围棋盘是由纵横直线形成的方格子,对战对手各执行黑白棋子,棋盘有纵横各19条直线,因此有361个交叉点,对战对手交替将棋子落入交叉点,最终围地多的人获胜。
其实只看规则很简单,初学者可以在10分钟内学习规则,但规则很简单,棋盘上什么也没有,什么也没有,没有初始值,没有固定值,棋局有10的171次方种的变化。 有人夸张地说,这是什么概念,宇宙的原子数相当大。 这与Deep Blue发明的狭义人工智能不同,西方局面的变化数要少得多,只通过整体计算就可以导出胜负概率,但围棋不能简单地编程执行,所以围棋不仅是人类历史上最好的象棋,也是人工智能必须克服的难点
老阿尔法go双脑象棋原理
其实至今为止,阿尔法围棋的AI已经改变了好几代。 最新版本是AlphaGoZero,以前的版本总称为旧的AlphaGoZero。 老阿尔法go的人工智能采用两脑协同工作。
首脑是战略网络( Policy Network ),根据整体形势预测对方下一步落后的位置,计算自己最好的下一步棋子。 他们是怎么做到的? 输入大量人棋谱,分析人类3000千年来的棋局输入,加强学习。 第二个大脑是价值网络,该网络在第一个大脑中选择落子来计算最终的胜利率。 不是简单地预测后手的形势趋势,而是直接计算棋手获胜的概率。
人类能够下前所未有的国际象棋,或者故意错误地使阿尔法go无能为力吗? 答案是否定的,阿尔法go的战略网络和价值网络不是单纯的预测和计算,而是反复强化网络,也就是和自己下棋,自己落子,自己猜测下一步,自己报销失败。 在重复过程中修正和提高精度,对机器来说一点也不费工夫。
AlphaGoZero左右格斗术
阿尔法gozero变得更强大了。 采用Reinforcement learning (强化学习算法)。 那个能力已经发生了品质的变化。 Deep Mind没有在这个版本的alpha go中输入人的棋谱,也没有教围棋的规则。 最初是单一的神经网络,在棋盘上自由地下棋,自我对战。 并在自我对战过程中不断发展、修正、调整,逐渐丰富自己的神经网络。
听起来像是金庸写的武学大家顽固的孩子们左右的格斗术。 自我游戏学习的加强过程,往往与婴儿长大成人的过程相似。
alpha go zero在自我对战中学习,因为不输入棋谱,所以不受人类局面的制约,开发了新的围棋战略。 实际上,AlphaGoZero的各局相当于新局,各局之后自己成为上级版的alpha go后,与上级版的alpha go对战,成为更上级的alpha go。
阿尔法go战绩
2016年1月,阿尔法go首次与人类对战,以5:0完胜了欧洲围棋冠军樊面。
2016年3月,alpha go在韩国首尔以世界围棋冠军李世石,以4比1的总分获胜。
2016年12月,alpha go master版在线注册,与世界各国高手对战,60战全胜。
2017年5月,AlphaGo Master在中国乌镇以3:0战胜了世界冠军科杰。 同月,他也赢得了由5名世界冠军组成的冠军队。
2017年10月,alpha go zero仅仅学习了三天,以100:0克服了打败李世石的alpha go。 40天后,阿尔法gozero击败了阿尔法gomaster。
alpha go除了赢得围棋比赛还有意义吗?
我们任何科学技术的发明都是为了更好地服务人类,更好地服务社会。 当今世界正处于工业3.0信息化时代,世界已经被数不清的数据填满,比起围棋的变化,如何从这些数据中获取有效的信息,归纳规则是很重要的。 气候变化数据、医疗数据、事故数据等。
人工智能是将来可能解决这个问题的技术之一。 为了发展像alpha go这样的人工智能,需要测试其算法是否能够被充分优化和自我提高。 机器在不断创造新的国际象棋方法的同时,也给人类带来了新的思维方式。 在此基础上,扩大其能力范围,使其真正为人服务。
我们现在做的是以人工智能为基础,相信未来的人工智能会给世界带来更多不可思议的体验。