谁是黄士杰 黄士杰和AlphaGo有什么关系 黄士杰研制出阿尔法狗吗

来源:时间:2017-06-01 10:12:43

Go如何获得形势判断的能力?

解决这个问题的人是席尔瓦。有天他对黄士杰说:“Aja,我有一个主意,我觉得可能会管用”。席尔瓦的主意后来被称为“价值网络”。当时黄士杰对这个主意非常怀疑,他回复说:“能管用么?咱们试试吧。”

价值网络也是一个卷积神经网络,输入是落子位置,输出0-1之间的数字,0代表对手胜利,1代表自己胜利,如果差不多就输出0.5。(Google最近公布的数字是-1~1,略有不同)。

总之,AlphaGo通过自我对弈,训练出价值网络,进而可以判断每一手棋背后代表的胜率。这就形成了形势判断的能力。

价值网络的出现,让AlphaGo棋力突飞猛进。与Crazy Stone的对弈中,AlphaGo胜率达到95%,也就是达到让两子的水平。

“当时AlphaGo已经可以碾压我了,我已经感觉到它的强大”黄士杰回忆说。

2015年10月

也是8月,樊麾在参加欧洲围棋大会,回到法国的家中。他收到一封电子邮件,发件人是AlphaGo团队的Maddy。邮件内容非常简单:我们是一家伦敦的公司,希望邀请你来我们公司。也没有更多信息。

樊麾一度认为是垃圾邮件。但鬼使神差,他回了邮件说:“可以呀”。然后他们用Skype进行了在线沟通,席尔瓦当时也参加了,他们给樊麾讲述正在做有趣的项目,也讲述了自己是一家Google收购的公司。

随后樊麾上了DeepMind的官网,确定有这么一家公司,以及公司主页上还提到了围棋的字样。于是他下定决心过去看看。

双方第一次见面是9月底,当他确定自己要跟一个围棋程序对弈时,整个人一下就放松了,心说:“对付一个软件,还不分分钟的事儿”。樊麾当时甚至跟AlphaGo团队表示,他跟AlphaGo的下棋时间,只需要一个小时就够了。

当时黄士杰反

相关阅读

“中巴经济走廊”将给巴基斯坦带来什么?
    拉合尔市(Lahore)五洲明珠大酒店(Pearl Continental Hotel)的大...
特斯拉汽车Model X在华爆炸 车主要求巨额赔偿
    5月1日消息,今年2月一辆特斯拉Model X在广州发生碰撞事故后起火...
林卓延主席被授予“圣亚加塔‘都尉’荣誉”勋章
    林卓延主席到访圣马力诺参观考察,并被授予“圣亚加塔‘都尉’荣...