「智能」起源的一种可能性
(function(){
var cover = "http://mmbiz.qpic.cn/mmbiz/dcEP2tDMibccgVVllgiciatJDJpTFLibNs9EFEp0ib040CmwIXib0BvvibP2pu1lZeZoSErDVFBGP92LV1QibjA5dNtWAw/0";
var tempImg = document.createElement('img');
tempImg.setAttribute('class', 'rich_media_thumb');
tempImg.setAttribute('id', 'js_cover');
tempImg.setAttribute('data-backsrc', cover);
tempImg.setAttribute('src', cover);
tempImg.setAttribute('onerror', 'this.parentNode.removeChild(this)');
document.getElementById('media').appendChild(tempImg);
})();
本文选自 知乎专栏 生命设计的原则,作者为傅渥成 《写在物理边上》作者
在《世界奇妙物语》中一个故事叫《逆男》,故事里面的男主角不管做怎样的选择都会遇到挫败:例如,排队总是会排到前进速度最慢的队伍,要是恰好排到自己了说不定里面的工作人员又恰好得去吃饭了;如果同时来了两辆公交车,选择的那一辆要不是到了某一站就会挤满人,要么就是在半路会抛锚……突然这一天,这位逆男心想:既然自己的每个选择都注定会错,那干脆每次都不按照自己的内心想法做好了,明明觉得应该排在左边,那就选择右边吧——从此,他就走上了人生巅峰,在公司的业务也做得越来越好,越来越有钱,越来越被领导赏识,唯一不满的是他的女朋友,他的女朋友觉得原来心地善良的这位逆男同学「变了」,最终,逆男面临心灵的选择——是选择抛弃女朋友,到公司的美国分部去做经理呢;还是留在日本跟女朋友在一起。他的内心无比热爱他的女朋友,但是他知道,只要是尊重内心的想法,最后的结果总是不好的,于是他无比矛盾。终于,在前往机场的路上,他最终还是按照自己内心的想法做了,他决定留在日本跟女朋友在一起,这时镜头一转,他的女朋友已经跟他的好基友在一起了,他再次做出了一个错误的选择。
在《逆男》的故事里,逆男产生了一种能力,可以做出「正确」的选择,这种奇怪的超能力是怎么形成的呢?怎样判断什么是正确的选择,什么又是错误的选择呢?
以玩游戏为例,在各类游戏中,玩家会需要在各种各样的分支中进行选择——但最终的成功者就是能坚持到最后的人。各类游戏虽然追求的目标不同,有的是为了吃掉对方的棋,有的是为了从管子之间穿过,有的是为了收集更多的装备,但是这其中有某种共同性的东西——我们自己不能死,并且,不能让自己陷入绝境,即,我们不能因为这一步当前的选择,陷入到下一步无路可走的境地。
有了这样的一个想法,我们可以很自然地来考虑「最优选择」的方向,最优的选择,就是让未来的可能最多的选择。我们希望构造一个量来描述这种现象,怎样来构造这个量呢?更有意思的,如果我们考虑一个实际的物理体系,怎样构造一种「力」,让受到这种力的物体变成「逆男」,能够总是做出「正确」的选择呢?
我在这里介绍一篇文献的有关内容。在哈佛大学和麻省理工大学工作的 A. D. Wissner-Gross 在他在 2013 年发表的一篇 PRL 文章中提出了一种方案。这种方案构造出一种「因果熵力」,系统在这种因果熵力的作用之下,可以朝着选择更多的方案上去演化。这一方法的具体推导在这里我不详细介绍,有兴趣的朋友可以直接阅读那篇论文。这篇关于路径熵力的文章可以在作者的个人主页上下载:http://www.alexwg.org/publications/PhysRevLett_110-168702.pdf。
我希望选取一些有意思的细节来对问题进行讨论。主要集中来说明关于这一概念的一些关键点以及几个那篇文章中介绍到的例子:
1、这种「因果熵力」只对于平移对称性破缺的系统才存在。因为如果不存在这种对称性破缺,那么往左走还是往右走其实都是一样的,因此系统需要在某个位置处存在某种约束,越过那个约束的演化是不被允许的,因此当粒子处在边界上的时候,就像在游戏中被打倒只剩下一滴血,这时候它的选择变得更少,它能做的就只是回头了。我们希望构造这样一种力,帮助粒子避免这样的困境,因此首先前提是环境中存在这样的困境。如果在全空间内随机运动,没有任何限制,那么每个空间中每个点都是等价的,那么不需要做任何优化,就可以认为这个熵力就等于 0 了。还有值得一提的是,系统未来演化的「可能性」不只是针对那些受到因果熵力驱动的自由度而言的,「状态数」的计算还应该包括不受这种熵力影响的其它自由度。
2、这种「因果熵力」来源于外界环境热浴带来的能量输入。因为如果没有外界能量,系统只会在传统牛顿力学、量子力学等框架下演化,而一旦有了能量输入,系统的演化可以变得更不一样一些,例如生命可以从环境中获取能量,从而逆天地建构起有序的结构;
3、考虑单粒子的情形。对于单粒子的运动,其实没有办法严格定义「温度」,不过我们可以引入一个等效的温度 T。我们这样看,规定某个起点,让粒子受到随机力、摩擦力等等的作用,从起点出发,开始演化。如果觉得一个粒子还不够过瘾,我们可以复制很多个这样的系统,在每个这样的系统里,粒子都从给定的起点出发开始演化。等到了时刻 t ,我们让所有的这些系统的演化都停下来,每个粒子都在相空间中演化出了一条轨道。如果所有的这些轨道都相当稳定,即粒子难以在不同的轨道之间发生转换,则认为此时的等效温度是很低的。等效温度低,则说明系统各条演化轨道各自都很稳定,即玩家总是倾向于固定的模式去玩游戏,而等效温度高,则对应于玩家更灵活一些,会在许多不同的模式之间切换。
「因果熵力」可以驱动粒子朝向某种「最优」「最智能」的方向演化。模拟这一过程的方法是这样的:我们首先在不引入这种力的情况下让系统运转起来,系统在初始时刻受到可能朝各个方向运动的随机力,也会因此演化出来各种各样的轨道,我们对这些不同的轨道进行一个路径积分,每条路径的权重就是这一条路径的信息熵,以此为权重,对那个随机力进行加权平均,这时候,权重更重的方向就会是未来可能性更多的方向——也就是前面提到的「因果熵力」的方向,也就是让系统变得更聪明、能做出更智能的选择的方向。下次正式模拟的时候就不再用「随机力」了,而是可以直接用这个已经计算好了的因果熵力来驱动粒子进行运动。在前面的描述中,有两个参数:其一是「温度」,「温度」反应了在不同的路径之间切换的灵活的程度,因此「温度」越高,越灵活机动,让你变得更聪明的力就越大;其二是「时刻 t」,这是我们初始进行计算时候选取的一个用于学习的时长,学习了长为 t 的历史经验,我们可以期待它有时长为 t 的远见,因此,t 越大,系统就能在越长的时段内一直被推动往更聪明的方向发展。
说了这么多,来看看具体的例子吧,这几个例子都来自于作者的原文。
例 1,粒子在一个盒子内运动,如果给它一个变得更聪明的力(即文中的「因果熵力」),那么粒子会被驱动往盒子的中心运动。因为在这里,它未来的选择是最多的。
例 2,一个「小车—硬杆」系统的示意图,也可以把它看成是用轻杆连着的一根单摆。在该系统中,硬杆最初是倒悬的,如果给小车这种「因果熵力」的作用,最终将倒悬的硬杆旋转到了竖直正立的状态,硬杆还可以稳定在该状态——这是因为硬杆直立起来之后,就有了向下摆的各种可能性,这种因果熵力正是要把系统驱动到未来选择最多的方向上去。作者还希望通过这个例子说明人类直立行走的原因,人类有灵巧的双手,只有直立起来,双腿行走(如题图),灵巧的双手才被解放出来做各种事情——这也是有某种进化的力量在驱动着生物体拥有实现更多的可能性的能力。
例 3,马克思主义者常常谈「工具的使用(和加工)」,在动物世界中,我们见到了黑猩猩用树枝吊蚂蚁;在小学课本里,我们听说乌鸦会用小石子取瓶子里的水喝;在日本,聪明的乌鸦甚至会把核桃扔到马路上,等汽车从核桃上压过去之后,等到红灯的时候,再飞下来,取外壳已经被压碎的果仁吃。作者在这里还用一个简单模型说明了工具使用的问题。如上图 (a) 中所示,圆盘 I 表示动物,跟装有目的物(圆盘 III )的细管子相比体积太大,它没有办法直接进入管内,而工具(圆盘 II )却正好足够小;(b) 动物(圆盘 I )与工具(圆盘 II )发生碰撞;(c) 工具(圆盘 II )进入到管内与目的物(圆盘 III )发生碰撞;(d) 目的物(圆盘 III )被成功地从管中其初始位置附近释放出来,进而终于可以被动物(圆盘 I )直接操纵了。这一动画可以到我在本文最后提供的地址中去下载。同样的,如果目的物一直待在管子里,那它的状态也就是总是被限制住的,只有被释放出来,才能有更多的可能性——「因果熵力」正是驱动系统往这一方向演化的、来源于外在环境的一种力。
例 4,我们来考虑与合作有关的问题。这一物理模型也有许多动物实验作为支持。在实验中,一对动物需要同步地拉动一根绳子(或者细线)的两端拉手,目的是为了取得一个位于受限制区域的物体(圆盘 III)。圆盘质量与拉力之间的关系是被精心设计过的:相比起不同步的、或单侧的拉伸,当两个动物(小圆盘 I 和 II)同步地在绳子的两端向下拉时,会对圆盘 III 产生更大的拉力。圆盘 III 只有被拉下来,才能被两个小动物(圆盘 I 和 II)玩耍(发生水平方向的运动),即只有这样才有更多的可能性。那么,这一物理体系在因果熵力的驱动下,会发生怎样的运动呢?如上图,图 (a) 是初始初始构象,并且两个小动物被特地设置成不在一条水平线上(不同步);图 (b)中的两个动物(圆盘 I 和 II)已经自发同步了它们的位置,并且在绳子的两端把手一起向下拉;图 (c) 中,目标物(圆盘 III)已经被成功地拉到了 可以被直接接触和操纵到的位置;图 (d) 中两个动物(圆盘 I 和 II )正在直接操纵目标物(圆盘 III),并且目标物在水平杆上还可以发生水平运动。
通过以上的这些例子,我们隐约感受到了「最大化未来的可能性」与「智能」之间存在的某种联系,「因果熵力」似乎从物理学家的角度,用数学公式和计算模拟为这种尝试做出了第一步。我们甚至发现,这个例子里面举的各种实例,虽然非常粗糙,但是的确已经初步具有了表现出与生物「精神世界」「认知领域」有关的复杂行为。这一研究结果表明,开放系统中的非平衡过程作为一种普通的热力学模型,如果加上这种能驱动系统往更多可能性的方向上运动的「因果熵力」,就很可能可能具有对适应性行为进行数学建模的潜力。这篇文章发表之后,其思想被许多媒体转载和引用:
“Causal Entropy” Linked to Intelligence
http://disinfo.com/2013/04/causal-entropy-linked-to-intelligence/
Intelligent Robots Should Maximize Their Future Options
http://nootrix.com/2014/02/intelligence-equation/
下面是关于因果路径熵的应用的影片,长度3分钟,我们在网上还能看到作者的许多演讲视频,大家可以去这篇文章的作者的个人主页上去观看:Alexander D. Wissner-Gross, Ph.D.
知乎精彩评论
邓翔 回复 傅渥成(作者)
若是按照这一方法建立了一个智能,要如何解读它呢
傅渥成(作者) 回复 邓翔
我这样理解,你看对不对,这种「智能」希望解决的问题是,最大化未来的可能性。
如果比喻成玩游戏,传统的「智能」就可以简单理解成消灭对手;而现在的这种「最大化未来可能性」的策略就是——自己不能死,还要让自己的血尽可能多,技能尽可能的多、装备尽可能的多……因为这些东西的组合可以让系统未来有更多的可能性。从历史经验中,通过学习,构造这样一种力,能让系统往最大化未来可能性方向上去演化,大概就是这样。
伍晨
有个问题,我们的这个世界是平移对称性破缺的吗?如何定义“平移对称性破缺”?
傅渥成(作者) 回复 伍晨
那个是对物理体系而言的,就是说,在时刻 0 往方向 A 运动比往 B 方向上运动,可能更有帮助在时刻 t 拥有可能更多的可能性,那么就是平移对称性破缺的。
如果在全空间内随机运动,没有任何限制,那么每个空间中每个点都是等价的,那这个力就等于是一个随机力,没有什么别的效用在其中,就可以认为这个熵力就等于 0 了。
张始
作者,你好。首先感谢你分享这篇拓宽视野的文章。我有个问题,系统寻求最多数选择的意义是什么?系统本身无意识,人为施加的指令才导致其寻找最多数选择吧?那系统(足够智能化后)会不会为了寻求更多数选择,最后抛弃了人类的这个起源性指令呢?
傅渥成(作者) 回复 张始
我说一些我自己的看法,你也有可能不一定同意我的观点:
在目前这个问题的讨论里面当然就是人为引入了那样一个力驱动系统到那样一个状态,在这个问题里你没有办法看到这种选择的意义的,例如粒子扩散到盒子的中心,到中心虽然可以有的选择最多,但是在边界上也总还是有些选择——但是如果问题变化一下,假如粒子一碰到盒子就不再能继续演化,例如边界上都是某个动物的天敌,动物为了活下去,就会朝着盒子的中心运动,这是很自然的事情,这种时候那种「指令」的意义就能看得更明白一些。在具体的问题里面,可能是生物希望「活下去」,也可能只是为了尝试一下新鲜的东西,还可能只是巧合,只是模仿其它粒子的行为——但是具体是什么我们先不去讨论它,我们先不讨论这种「意识」是什么,先只是去构造一个这样的力,这样的力在以后讨论各种具体的问题的时候可以来用,就是这样。
系统足够智能化之后当然可能会抛弃这个「指令」,例如人类就经常感情用事、不考虑长远利益、将自己置于绝境。当然,这些看起来错误的选择有时候从集体行为的角度也可能会有一些别的解释,这里不讨论那些。而且,就算这种「指令」一直还在,不同的生物心目中的对应的那个特征时间长度 t 也不一样,例如大家都希望在未来有更多的选择,但是有的生物因为寿命短,可能他们在竞争中就是朝着比较短视的方向在进化,因此倾向于在局部选择最优,有的生物就是比较远视,会倾向于考虑在更遥远的未来自己(或者后代)有更多的选择。这些策略也说不上究竟哪个更好,因为即使是很「远视」的生物,如果突然环境骤变,也可能难以生存下来。但是,仔细想想,以生态系统为例,环境的变化总是相对比较慢的,更「远视」,更灵活应变的生物在很多的时候确实可能在这个过程中更好的适应环境,所以只要自然选择还在缓缓起作用,这种优化应该也就不会停止,这篇文章讨论因果熵力,其实关注的就是这样的系统。同样的,如果某个智能系统渐渐「退化」,又或者渐渐变得更关注短时间的一些优化,长时间运行的结果不够好,那么只要人们对长时间的预测有需要,肯定就还是会有人弄出新的系统来打破旧系统的纪录,然后大家一定会选择这些新的系统……我相信这种「选择」会一直存在,虽然可能有时候转变会来得很慢(就像中国用户都用 xp 那样),但从更长的时间尺度来看,某个系统自己变得怎样其实也不重要,只要还有竞争和选择。
苗同学
这个不就是遗传算法么
傅渥成(作者) 回复 苗同学
确实很像,但是还是有一些不同点,例如:遗传算法更强调对所有状态的离散化表示,只有离散化之后才好设计遗传、突变和杂交等等;设计遗传算法的目的就是为了不去遍历全空间,而这里路径积分的计算是需要遍历一段时间内的所有可能状态的;最重要的是,遗传算法始终是为了一个目的(最大或最小值)在进行遗传和突变,而这里每次是为了从当前开始 t 步以内的未来在做优化,每一步演化之后都有可能需要选择一个新的演化方向。
如果你针对这篇文章有什么问题,欢迎向本公众号留言,我们会将您的问题转给原作者,请他回答,并将好的问题与答案与大家分享。
欢迎关注 混沌巡洋舰 追寻自然界复杂下的简单,带你跨界学习各路干货
欢迎加小编铁哥个人微信562763765 或东哥 grd31189