战胜“阿尔法狗”的“阿尔法元”丨体育经理人

时间：2018-09-04 00:07 来源：足球直播

标签：围棋柯洁 AlphaGo

前年，AlphaGo Lee打败了韩国棋手九段李世石；去年，AlphaGo Master打败了世界上最年轻的世界冠军中国棋手柯洁。一时间“阿尔法狗”在围棋界可谓“打遍天下无敌手”享受到了唯我独尊的荣耀。同时，以阿尔法狗为代表的AI（人工智能）也成为街头巷尾都在谈论的话题，神秘而又充满智慧的AI颠覆了人们的传统认知。就在人们还没有搞懂阿尔法狗的时候，它的“弟弟”阿尔法元（Alpha Zero）又横空出世。并且它的“弟弟”以100:0的惊人成绩战胜了“哥哥”，下面纪胖就带你认识更加强大、更加“可怕”的阿尔法元。

忆往昔

柯洁的泪与阿尔法狗的笑

我想，在了解阿尔法元之前有必要回顾一下“哥哥”阿尔法狗，轰动世界的人机大战早已随风而逝，但写就的传奇却将永远被世人铭记。

当DeepMind公司团队宣布阿尔法狗将不再参加围棋比赛后，这名有史以来“最强棋手”消失在了人们的视野。但留给世人的耀眼战绩至今依然令人动容：4比1战胜世界围棋冠军、韩国传奇棋手李世石；依次对战数十位人类顶尖围棋高手，取得60胜0负……当然，最被人熟知的当属3比0战胜中国棋手曾经的围棋第一人柯洁。那场比赛，留给人们太多的回忆，其中尤以第三局柯洁泪洒当场的情景令人难忘。

随着阿尔法狗一场场的胜利，奠定了这位“最强棋手”在围棋江湖中的霸主地位，这一场场胜利的背后也凝聚了阿尔法狗日复一日的“刻苦努力”。实际上阿尔法狗借助48个TPU（神经网络训练专用芯片），参考了海量人类棋谱，并自我对弈3000万盘，又经数月训练，才以4:1大败韩国九段棋手李世石、以3比0战胜人类最强棋手中国的柯洁，最终封神。这完全可以说是一个励志故事了，但是它的“弟弟”阿尔法元可没有它这么刻苦，阿尔法元的先天条件良好，是个不折不扣不需要努力就能成功的“富二代”。

100:0战胜阿尔法狗

展示AI顶尖水平

阿尔法元不像阿尔法狗那样进行海量的数据分析和自我对弈，而是去进行自我学习，另辟蹊径，从根本过下手：它仅仅被告知如何从零开始学围棋的原理，然后加入了若干种算法。人们一般认为机器学习就是大数据和海量计算，但是阿尔法元让科学家们意识到，算法比计算、数据更加重要。要知道，在阿尔法元上使用的计算，要比在阿尔法狗上使用的少一个数量级，但是，运用了更多的算法，这就使得阿尔法元比阿尔法狗更加强大。阿尔法元诞生之后，能力日渐增强，在第3天，就以100:0的成绩打败了战胜李世石的AlphaGo Lee；到第21天，打败了战胜柯洁的AlphaGo Master；到第40天，就打败了过去的所有阿尔法狗，这是连科学家自己都惊艳的成绩。

阿尔法狗用了40层策略网络和价值网络：前者用于分析局面，预测下一步行动，帮助缩小选择面；后者则用于评估这步棋的胜率值。同时，快速走子系统也在运行，以在稍微牺牲走棋质量的前提下，提升运算速度。最后，再用一种搜索算法把以上三者连接起来。

但是，阿尔法元则直接去掉了快速走子系统，策略网络与价值网络也被结合到一起，关于人类围棋知识的系统基本都被删掉了。因此，在自我对弈初期，阿尔法元常常会出现一些很诡异的棋局，但是这也让它在后期会出现很多出其不意的方法。这与当今大数据下各种数据都被总结为规律确定大方向的趋势似乎有些不符，不禁让人们开始思考新的发展方式和方向。

然而，话又说回来，无论阿尔法元多么可怕，AI多么强大，它都应以人性为底线，以伦理、道德为标杆，就像阿尔法狗在打败柯洁后宣布不再与人类对战，确保了人类围棋生态的平衡一样。 AI的发展都应为人类服务，只有这样才能让AI散发出更具人性的魅力。