谁是黄士杰 黄士杰和AlphaGo有什么关系 黄士杰研制出阿尔法狗吗
了胜利。
但他们就这样出发了。
2014年6月-2015年6月
这年夏天,AlphaGo的第一个重要武器出现了。在卷积神经网络的帮助下,AlphaGo学习了很多人类高手的棋谱,能在3毫秒内做出比肩人类的下棋直觉。后来黄士杰给这个武器命名:“策略网络”,并且持续进行训练优化。
这个时候,AlphaGo的训练还是在GPU上完成的。
时间再过一年。2015年6月,AlphaGo拥有了更强大、分布式的搜索技术支持。阅读棋局的能力大幅提升,可以检索多种局面变化,并且找到最佳的应对方式。这个时候的AlphaGo,可以算出后续40-60步棋。
(击败柯洁的最新版AlphaGo,也只算到50步棋就停止了。)
当时在相同的硬件条件下,AlphaGo对另一个围棋程序Crazy Stone取得了70%的胜率,换句话说棋力领先了一个子。这个成就让整个DeepMind都很受鼓舞,哈萨比斯这时候对黄士杰说:
“Aja,咱们要组一个团队,你不用再单打独斗了”。
从这时候开始,逐渐有更多的深度学习工程专家加入AlphaGo团队。黄士杰还为新加入的同事办了一个训练班,普及基本的围棋规则。
黄士杰
2015年8月
与此同时,另一个重要的节点已在不远。两个月后,AlphaGo将掌握称霸围棋世界最关键的能力:形势判断。
“事实上,形势判断是围棋过程中最难、最令人头疼的环节,要进行准确的判断,必须具备精确测算双方目数的能力,同时还要兼备综观全局的大势观、挖掘潜在价值的分析能力和推理能力……要下出真正具有水平的围棋,形势判断十分必要。”
上面这段话,来自李昌镐。这位绰号“石佛”的韩国棋手,从1992年夺得第一个世界冠军开始,到2007年为止共获得18次个人冠军、13次团体冠军,开创了“李昌镐时代”。
Alpha
相关阅读
-
今日必看
- 精彩话题