信息的俩种定义

对于信息这样一个我们日常习以为常的词汇,厘清其所指内涵,可以指导我们如何理解并指导由这个词派生出来的一系列词汇,比如信息经济,信息技术革命。本文受到《Possible Mind》(点击查看对应的读书笔记)中题目为““INFORMATION” FOR WIENER, FOR SHANNON, AND FOR US”的影响,在原文基础上,用极短的篇幅,复述原文的观点并加上了自己的演绎。

当我们在日常生活中谈论信息时,往往是将多个内涵不同的东西混为一谈,这样的一词多义是造成不同背景的人交流不流畅的主要障碍。在不同的语境下,不同的词语本应该有不同的含义,但如果一种含义的语境占据了主导地位,就会侵蚀其他含义所应占有的空间。比如信息通常指的是这句话这段文字的含义(meaning),但按照香龙在信息论中的定义,信息指的是信源的不确定性的消失程度,信息和熵联系了起来。

但在维纳的《人有人的用处里》,信息带上了古典时代的光辉,值得是莎士比亚的戏曲,是荷马的诗,是一个人不坚持要说出的,而不是为了让自己获利而说出的话,维纳多少有些激动的提及艺术家,科学家和文学家之所以创作,应当是受到这样一种不可抗拒的冲动所驱使。即使他们的工作没有报酬,他们也愿意付出代价来取得这项工作的机会的。带着激情写出的东西,虽然在信息论看来,不具有什么特殊性,但在维纳眼中,这与当下为了大部分为了评职称晋升而发的paper有根本的区别,前者有机会让人成为信息流动的载体,从而促使整个社会摆脱孤立系统的限制。

信息在维纳的描述中,是不可以被交易,被控制的。维纳写作的时代,原子弹的制造工艺是严格被控制的秘密,但维纳却认为这样的控制,在长期来看是无效的,再多的保密,也无法组织他人通过自己的摸索做出原子弹,因此关于原子弹唯一重要的信息是这东西是可能被造出来的。读到这里时,我想到了所谓的信息,应该是能扩展人类认知边界的东西,是能够让我们能更好的发挥自己想象力的东西,站在科幻的角度去看论文,我会想在解读一篇科研论文的时候,能够就此展开一个怎样的脑洞,想象这项研究的成果可能怎样被滥用或和其他已有的成果组合。

维纳也反对信息的交易,他如果活到现在,听到数据被当成了新时代的“油田”,一定会对此提出强烈反对。维纳的控制论强调反馈的持续进行,他在书中写道“社会通信是社会这个建筑物得以粘合在一起的混凝土”,这里的通信,包括了人与人,人与机器,机器与机器之间的双向沟通。正如同熵无法被交易,信息的传播也成为商品。但为何当下大数据会成为人人向往的富矿了,这就牵扯到信息的定义上了。维纳所说的信息,不同于当下交易的香龙式的信息。

当下我们所说的大数据,都是对应着人的爬行动物脑,这里是纯粹的本能驱动的,是统计规律可以奏效的,而且越是细微的统计差异,应用到大人群上,就越能看出意想不到的差别。因此有了数据的加持,就能够创造出信息茧房,并以此寻租获得暴利,但从filter bubble中无法产生维纳所说的信息。人的多样性与可能性也会由于对维纳口中的信息的忽视而被荒废。最终的结果是人无法保持稳态,无法根据过去的经历来调节未来行为,而在个人看来,就是什么都有了也任然无法感受到幸福。

当下的人工智能,也是围绕着香龙定义的信息构建的,不只是主要做预测的监督学习,大多被用来预测那一个链接会被点击,对于玩游戏的强化学习,也只是为了战胜游戏。而人类通过反馈,可以从游戏之外获得更多的收获,例如从围棋中获得人该怎样生活的启示。当下的人工智能,也具有像维纳所说的信息方向去发展的潜力。例如通过增加因果推理,加入类比思维和好奇心。但要想向这个方面发展,人们首先要认清楚信息应该具有和当前人们所说的大数据不同的含义。

ps 本文是读《Possible Mind》,看25位大咖谈AI 系列读书笔记的第二篇,接下来还会有几篇类似的短文,来介绍这信息量很大的书。

更多阅读

如何让神经网络具有好奇心

基于一张“规则表”的人工智能

王淼2019-03-23 21:40:43

俩-两?香龙-香农?

作者

是的。。赞 1