读《科技想要什么》,说AlphaGoZero的大新闻
一年前,和朋友闲聊,他说AlphaGo的下一代是BetaGo,结果人家从Master升级成了Zero,俩个神经网络也变成了一个。一年前,人们讨论AlphaGo是否理解了围棋,人们举例说,如果围棋的棋盘变成了20乘20,那柯洁闭着眼睛都能虐狗,由此来说明AlphaGo并不懂围棋。 但有了从零开始的zero,改变了棋盘的大小,给我3天的时间,照样能够虐人类。
还有说狗狗不懂人类选手常用的围棋定式的。然而,从Zero的论文中看出来,恰好是那些学会定式慢的狗狗,棋下的好。不同版本的狗狗,最终都学到了围棋的定式,但若是过早的将选择定式的几率提高,那么会限制对未知模式的探索。从这个意义上来说,围棋的定式,何尝不是一种过拟合。然而只有等人类见识到了全新的风格,才能够意识到自己的不足。
之前我们反驳狗狗不懂围棋的论据,都被AlphaGo Zero打破了,但人类最擅长的是改游戏规则。给定一个选手最多只能记住10万张棋谱,下十万盘棋,在这样的限制下,人类在当下的技术条件下,无论如何都是赢家。但这说明人类理解围棋,学习围棋比AI快吗?答案是否定的。加上这个限制,说明人类由于自身的限制,将围棋变成了一个有限游戏,人类围棋的规则其实是在只记住十万棋谱,下过不多于十万盘棋时下出最好的棋,而AI的出现,将围棋变成了一个无限的游戏。
这里不是说围棋的可能性变成了无穷的,而是说计算机去掉了存储的限制,狗狗可以记住其下过的所有左右互搏的棋局,而蒙特卡罗树则将最后的输赢反馈到了最初的每一次落子上,解决了奖励时间的不确定性,而CNN则负责从中推导出该怎么评估当前的局势,将你的落子和整个棋局的大背景结合起来。这样的框架,适合无限游戏的假设。而人类棋手一开始学习定式,则是人类在其自身的限制下最佳的学习方式。人不必盲目的崇拜计算机,说到底,狗狗和人玩的是不同的游戏,自然应该有不同的玩法。
说完了狗狗,我们将视线拉远,猜猜狗狗下一步想做什么。人们对于未来的想象,常常是线性的。即使对于想象力丰富如著名的科幻作家凡尔纳,他设想的人类登月的方式也只是用大炮,然而真正改变世界的创新,最初都是不那么显著的,没有多少人会注意到。所以与其看狗狗下一步能做什么,不如看看狗狗做不了什么。与其看具体的行业,不如给出算命式的趋势预测。
有了AlphaGo Zero的框架,所有的完美信息环境下的零和式,有限个选择的策略游戏,都已经成了AI的天下。再结合AI战胜人类的德州扑克选手,对于即使不是一个信息完全公开的游戏,只要可能出现的选项是已知而未知的只是出现的概率时,AI占据绝对优势,也是必然的了。留给人类的唯一机会,就是不要去玩零和游戏,不去玩有限的游戏了。
有本书就叫《有限和无限的游戏》,书中写道,有限游戏以取胜为目的,而无限游戏以延续游戏为目的。有限博弈者在边界内游戏,无限博弈者以边界为游戏对象。有限游戏旨在以一位参与者的胜利终结比赛,每个有限游戏都是为了结束自身。矛盾恰恰就在于,所有有限游戏都是在对抗自身。在这本书中,作者提醒读者转化游戏观,认识到生活其实不应当被看成是有限的游戏。
凯文凯利在《科技想要什么》中对《有限和无限的游戏》十分称赞。书中写道:
进化、生命、思维和技术元素都是无限博弈。它们的博弈就是让博弈持续下去,让所有博弈者尽可能地长时间参与。为了达到这样的目的,它们像所有无限博弈一样戏弄游戏规则。进化之进化就是如此。
生活中我们最爱的事物──包括生活本身──都属于无限博弈。当我们参与生活博弈或技术元素的博弈时,目标不是固定的,规则不明朗,并且一直在变动。我们如何进行下去?好的选择是增加选择。
无限博弈的目标是保持游戏的进行:摸索游戏的所有玩法,增加各种博弈,召集所有可能的玩家,扩展游戏的意义,倾尽所有,无所保留,创建宇宙中不太可能发生的博弈。
弄清楚了无限博弈的思路,就能够再一个大的框架下去看狗狗战胜人类的这件事,狗狗的出现,将围棋这种有限的游戏,转化成了一个无限的游戏。游戏的目地不再是为了获得世界第一,而是为了探索出围棋中的所有玩法。狗狗胜利的方式,是狗狗背后的Deep mind巧妙的改变了游戏规则,而不断改变游戏规则,正是无限游戏唯一的规则。
说完了哲学性的话题,这篇小文就以AI取代职业这个话题来结束吧。很多人会问自己,你的工作中有百分之多少是可以被AI所替代的,然后据此评估AI是否会取代你的工作,但从有限和无限的游戏这个角度来看,你要问自己的问题的答案会是更主观的。你问自己在做的工作,究竟是该被当成有限的游戏,还是无限的游戏。
一个餐厅的服务员的工作,是自动化程度很高的,但这并不意味着未来餐厅服务员这个职业会消失,米其林餐厅,国宴会,服务员的岗位总是在的。一个服务员若是将自己的工作时间看成是零和的游戏,那么她必然会担心自己的岗位丢掉,而她的担心会使得她忽略由于游戏边界的改变而带来的新机会。而如果她只是将餐厅的服务员工作看成是无限游戏中的一部分,那么在机器人取代一步步取代服务员的过程中,她会随之成长,找到新的坏境下新的角色。你的担忧反映的更多是你对自身角色的看法,而不是事实。
原创不易,随喜赞赏
更多阅读
西葫芦佑佑2017-10-24 13:33:24
非常有启发!终于想明白了:经济学的底层逻辑不是收益最大化,而是游戏可以继续!
mary2017-10-24 06:56:00
热点之下的宽度思考
威斯特法伦的挂猪蹄2017-10-25 09:47:09
这篇文章是对《增加就业岗位》那篇的进一步阐释么
0+12017-10-24 16:24:40
无限闭环的思维方式