谁是黄士杰 黄士杰和AlphaGo有什么关系 黄士杰研制出阿尔法狗吗

来源:时间:2017-06-01 10:12:43

了胜利。

但他们就这样出发了。

2014年6月-2015年6月

这年夏天,AlphaGo的第一个重要武器出现了。在卷积神经网络的帮助下,AlphaGo学习了很多人类高手的棋谱,能在3毫秒内做出比肩人类的下棋直觉。后来黄士杰给这个武器命名:“策略网络”,并且持续进行训练优化。

这个时候,AlphaGo的训练还是在GPU上完成的。

时间再过一年。2015年6月,AlphaGo拥有了更强大、分布式的搜索技术支持。阅读棋局的能力大幅提升,可以检索多种局面变化,并且找到最佳的应对方式。这个时候的AlphaGo,可以算出后续40-60步棋。

(击败柯洁的最新版AlphaGo,也只算到50步棋就停止了。)

当时在相同的硬件条件下,AlphaGo对另一个围棋程序Crazy Stone取得了70%的胜率,换句话说棋力领先了一个子。这个成就让整个DeepMind都很受鼓舞,哈萨比斯这时候对黄士杰说:

“Aja,咱们要组一个团队,你不用再单打独斗了”。

从这时候开始,逐渐有更多的深度学习工程专家加入AlphaGo团队。黄士杰还为新加入的同事办了一个训练班,普及基本的围棋规则。

黄士杰

2015年8月

与此同时,另一个重要的节点已在不远。两个月后,AlphaGo将掌握称霸围棋世界最关键的能力:形势判断。

“事实上,形势判断是围棋过程中最难、最令人头疼的环节,要进行准确的判断,必须具备精确测算双方目数的能力,同时还要兼备综观全局的大势观、挖掘潜在价值的分析能力和推理能力……要下出真正具有水平的围棋,形势判断十分必要。”

上面这段话,来自李昌镐。这位绰号“石佛”的韩国棋手,从1992年夺得第一个世界冠军开始,到2007年为止共获得18次个人冠军、13次团体冠军,开创了“李昌镐时代”。

Alpha

相关阅读

“中巴经济走廊”将给巴基斯坦带来什么?
    拉合尔市(Lahore)五洲明珠大酒店(Pearl Continental Hotel)的大...
特斯拉汽车Model X在华爆炸 车主要求巨额赔偿
    5月1日消息,今年2月一辆特斯拉Model X在广州发生碰撞事故后起火...
林卓延主席被授予“圣亚加塔‘都尉’荣誉”勋章
    林卓延主席到访圣马力诺参观考察,并被授予“圣亚加塔‘都尉’荣...