读《科技想要什么》，说AlphaGoZero的大新闻

2017-10-24 约 2243 字预计阅读 5 分钟

一年前，和朋友闲聊，他说AlphaGo的下一代是BetaGo，结果人家从Master升级成了Zero，俩个神经网络也变成了一个。一年前，人们讨论AlphaGo是否理解了围棋，人们举例说，如果围棋的棋盘变成了20乘20，那柯洁闭着眼睛都能虐狗，由此来说明AlphaGo并不懂围棋。但有了从零开始的zero，改变了棋盘的大小，给我3天的时间，照样能够虐人类。

还有说狗狗不懂人类选手常用的围棋定式的。然而，从Zero的论文中看出来，恰好是那些学会定式慢的狗狗，棋下的好。不同版本的狗狗，最终都学到了围棋的定式，但若是过早的将选择定式的几率提高，那么会限制对未知模式的探索。从这个意义上来说，围棋的定式，何尝不是一种过拟合。然而只有等人类见识到了全新的风格，才能够意识到自己的不足。

之前我们反驳狗狗不懂围棋的论据，都被AlphaGo Zero打破了，但人类最擅长的是改游戏规则。给定一个选手最多只能记住10万张棋谱，下十万盘棋，在这样的限制下，人类在当下的技术条件下，无论如何都是赢家。但这说明人类理解围棋，学习围棋比AI快吗？答案是否定的。加上这个限制，说明人类由于自身的限制，将围棋变成了一个有限游戏，人类围棋的规则其实是在只记住十万棋谱，下过不多于十万盘棋时下出最好的棋，而AI的出现，将围棋变成了一个无限的游戏。

这里不是说围棋的可能性变成了无穷的，而是说计算机去掉了存储的限制，狗狗可以记住其下过的所有左右互搏的棋局，而蒙特卡罗树则将最后的输赢反馈到了最初的每一次落子上，解决了奖励时间的不确定性，而CNN则负责从中推导出该怎么评估当前的局势，将你的落子和整个棋局的大背景结合起来。这样的框架，适合无限游戏的假设。而人类棋手一开始学习定式，则是人类在其自身的限制下最佳的学习方式。人不必盲目的崇拜计算机，说到底，狗狗和人玩的是不同的游戏，自然应该有不同的玩法。

说完了狗狗，我们将视线拉远，猜猜狗狗下一步想做什么。人们对于未来的想象，常常是线性的。即使对于想象力丰富如著名的科幻作家凡尔纳，他设想的人类登月的方式也只是用大炮，然而真正改变世界的创新，最初都是不那么显著的，没有多少人会注意到。所以与其看狗狗下一步能做什么，不如看看狗狗做不了什么。与其看具体的行业，不如给出算命式的趋势预测。

有了AlphaGo Zero的框架，所有的完美信息环境下的零和式，有限个选择的策略游戏，都已经成了AI的天下。再结合AI战胜人类的德州扑克选手，对于即使不是一个信息完全公开的游戏，只要可能出现的选项是已知而未知的只是出现的概率时，AI占据绝对优势，也是必然的了。留给人类的唯一机会，就是不要去玩零和游戏，不去玩有限的游戏了。

有本书就叫《有限和无限的游戏》，书中写道，有限游戏以取胜为目的，而无限游戏以延续游戏为目的。有限博弈者在边界内游戏，无限博弈者以边界为游戏对象。有限游戏旨在以一位参与者的胜利终结比赛，每个有限游戏都是为了结束自身。矛盾恰恰就在于，所有有限游戏都是在对抗自身。在这本书中，作者提醒读者转化游戏观，认识到生活其实不应当被看成是有限的游戏。

凯文凯利在《科技想要什么》中对《有限和无限的游戏》十分称赞。书中写道：

进化、生命、思维和技术元素都是无限博弈。它们的博弈就是让博弈持续下去，让所有博弈者尽可能地长时间参与。为了达到这样的目的，它们像所有无限博弈一样戏弄游戏规则。进化之进化就是如此。

生活中我们最爱的事物──包括生活本身──都属于无限博弈。当我们参与生活博弈或技术元素的博弈时，目标不是固定的，规则不明朗，并且一直在变动。我们如何进行下去？好的选择是增加选择。

无限博弈的目标是保持游戏的进行：摸索游戏的所有玩法，增加各种博弈，召集所有可能的玩家，扩展游戏的意义，倾尽所有，无所保留，创建宇宙中不太可能发生的博弈。

弄清楚了无限博弈的思路，就能够再一个大的框架下去看狗狗战胜人类的这件事，狗狗的出现，将围棋这种有限的游戏，转化成了一个无限的游戏。游戏的目地不再是为了获得世界第一，而是为了探索出围棋中的所有玩法。狗狗胜利的方式，是狗狗背后的Deep mind巧妙的改变了游戏规则，而不断改变游戏规则，正是无限游戏唯一的规则。

说完了哲学性的话题，这篇小文就以AI取代职业这个话题来结束吧。很多人会问自己，你的工作中有百分之多少是可以被AI所替代的，然后据此评估AI是否会取代你的工作，但从有限和无限的游戏这个角度来看，你要问自己的问题的答案会是更主观的。你问自己在做的工作，究竟是该被当成有限的游戏，还是无限的游戏。

一个餐厅的服务员的工作，是自动化程度很高的，但这并不意味着未来餐厅服务员这个职业会消失，米其林餐厅，国宴会，服务员的岗位总是在的。一个服务员若是将自己的工作时间看成是零和的游戏，那么她必然会担心自己的岗位丢掉，而她的担心会使得她忽略由于游戏边界的改变而带来的新机会。而如果她只是将餐厅的服务员工作看成是无限游戏中的一部分，那么在机器人取代一步步取代服务员的过程中，她会随之成长，找到新的坏境下新的角色。你的担忧反映的更多是你对自身角色的看法，而不是事实。

原创不易，随喜赞赏

更多阅读

铁哥谈AI：浅析阿尔法元之元

机器学习：增加更多就业岗位

西葫芦佑佑2017-10-24 13:33:24

非常有启发！终于想明白了：经济学的底层逻辑不是收益最大化，而是游戏可以继续！

mary2017-10-24 06:56:00

热点之下的宽度思考

威斯特法伦的挂猪蹄2017-10-25 09:47:09

这篇文章是对《增加就业岗位》那篇的进一步阐释么

0+12017-10-24 16:24:40

无限闭环的思维方式