“看脸”这件事,还真没那么简单

以下来自 《我们如何看见,又如何思考》 的序言和书摘这是一本介绍我们是如何看见的书。从古至今,视觉都是思想家乐于讨论的话题,但是从现代角度来说,这些讨论大多很幼稚,眼睛确实就像一个照相机,但是视觉不止于此。也许你会觉得你能认出朋友的脸是一件稀松平常的事——古人甚至不觉得这是一个问题,但是事实上这并不简单。要真正地理解视觉,仅仅知道眼睛的成像原理是远远不够的,你还得知道大脑是如何解读外部世界的。

/pic/1_AySMDLo6ZLSdoibrVGNgk0woyBycLA.jpg违反直觉的是,大脑的运行其实很慢。大脑里的神经元和它们之间的突触的运行速度只有现代计算机的百万分之一。然而,大脑可以在许多感知任务上打败计算机。你可以在几百毫秒内从人群中认出你的孩子来。你的大脑是怎么做到的?它是如何从刺激——一片光、空气中的一丝振动、皮肤上的压力变化——里解读出外部世界发生了什么的?我们对于大脑所做的事情只知道冰山一角,但我们了解到的内容却又已经足够迷人。我在25岁时成了一名神经科学家,彼时神经科学这个学科尚未建立。时至今日,我对它的兴趣依然与当时相差无几,并没有随着时间日益消减。我目睹了我们对大脑认识的进展,也参与了一点儿微小的工作。这本书的总体叙事框架是“视觉是如何工作的”,从视网膜讲到了位于大脑颞叶的视觉中枢。与此同时,我也想带你参与一段科学旅程,看看神经生物学的基础工作是什么样的——不是像脱口秀那样,而是带你走到实验桌前看看实际的情况。因此我会穿插讲述一些实验室里的场景,也会介绍一些研究者。我们会一步一步地深入视觉。你会知道我们看到的世界并不是真实存在的世界,我们的视网膜会把真实世界的场景分解成碎片,每个碎片表征场景的一部分特定信息,然后分别用不同的通道传输给大脑。这个打碎重编的过程是由视网膜里的神经元完成的。我们将跟踪这些进入大脑的信号,它们将在那里构建出我们的感知。
学着去看

加拿大神经科学家唐纳德·赫布(Donald Hebb)认为视觉主要是后天习得的:复杂的感知都是通过体验的联结形成的,因为世界上的物体,其视觉特征都是成群出现,而不是一个一个孤立的。他认为视觉的形成的确依赖于体验。 证据来自那些天生失明、后来又通过治疗重获视力的人。麻省理工学院的**帕万·辛哈(Pawan Sinha)**是印度人,在一次回国访问时他意识到,在印度乡村中,可能有30万名儿童患有先天性白内障。辛哈组织了一个慈善项目,寻找这些孩子并将他们送到新德里,现代医院的外科医生用透明的人工合成的晶状体替换了他们的晶状体。 辛哈的团队在手术前、术后,以及数月或数年后检查了患者的视力。摘除白内障并不能立即恢复儿童的精细视力。世界在他们眼前混乱而模糊。但是随着时间的流逝,他们的视力开始改善。几个月后,他们能看到更多细节。许多人可以不用手杖走路了,能在拥挤的街道上骑自行车、认识朋友和家人、上学,并且开展各种需要视力的活动。 /pic/2_Dn6xaAql79DvfjTibMkyyWojkvuiaA.jpg看似简单的叠加图形,在白内障复明者眼中则成为一体的复杂图形
然而,他们的视力似乎从未变得完美。即使经过几个月的训练,他们的视力仍低于正常水平。有人评论说他可以看报纸上的头条新闻,但看不到小字号的正文。有些人在执行特定的视觉任务时遇到了麻烦,例如,将彼此重叠的两种形状分开,如上图所示。 我们大多数人都将这张图片看作与正方形部分重叠的三角形,但是一些新近获得视力的人只将这些线条组成的图案视为单个复杂的对象。
这么看来,大部分视力都可以在长大后恢复。但是有一些发现提醒我们,视觉系统的可塑性不是无限的
大脑中存在许多谜团,但是重要的一点是,大脑并不是一台固定连接的电话连接网,而是由一群神经元交联而成的神经网络。你现在听到神经网络或许总觉得它是计算机里的东西,但实际上它最早是由高瞻远瞩的加拿大神经科学家唐纳德·赫布(Donald Hebb)提出的。又过了一段时间,这个概念才被计算机科学家借用。随后几十年间,神经网络的潮流时进时退,而性能更强大的计算机终于令计算机科学家开创了机器学习这一新的研究领域,它更为人知的名字叫作人工智能。他们证明,计算机中的神经网络可以经过学习做出惊人的创举,这让神经科学家对大脑中的神经网络更感兴趣了。视觉大脑是一张神经网络

在我们学会了“看见”之后,视神经会在大量训练的帮助下,逐渐强化与脑对应区域的连接,形成一套复杂又快速的回路。见到某一张面孔的次数越多,回路越通畅,大脑也就能够更熟练地想起“我见过这张脸”。 /pic/3_RXykicHNVkeo4zA7T8kLr5mfkyfJcg.jpg
我们都知道一张脸的样子,但是当我们说一个细胞“识别” 一张脸时,这到底意味着什么?一张脸可以分解为不同的元素。实验人员可以从真实的或人造的面部中添加或减去这些特征。他们发现,如果缺少某些特征,细胞的反应会逐渐减弱。因此,面部选择性细胞对上图中左上方的脸部反应较弱,而对右下角的面部反应强烈,但是它确实对图中的所有图像(包括仅具有几个面部特征的形象)都有一定的响应/pic/4_17jic3hfhaBKuFeWZB2a8AVNR3L2Cw.jpg
流程大致如下:

  1. 视网膜对图像进行预处理,把它分解成许多相互独立的表征。2. 视网膜会投射到外侧膝状体,后者将会锐化感受野,并掌控着流向大脑皮质的信息闸门。3. 初级视觉皮质V1会对感受野进行转换,大多数V1神经元对有朝向的线条反应最强。4. 在V1和V2中,有些细胞被称为“复杂细胞”。复杂细胞也对边缘的朝向有反应,这代表着一步抽象化,它们对特征的分析将独立于特征的原始位置,不再局限于完全反映视觉输入。5. 皮质区域V3和V4包含的神经元的偏好更多样化。它们会投射到颞叶的视觉区域。6. 颞叶下部的皮质区域是一群混合的神经元斑块,这些斑块各自对不同的事物敏感。有些斑块专门从事识别面孔。7. 从颞叶的后部到前部,细胞越来越具有位置不变性,也就是说,它们对人脸的识别独立于其在空间中的精确位置或方向。8. 继续向前,在更高的脑区,如靠中线的颞叶和更高的皮质区,细胞只对特定人或物的图像敏感,而无关它在视野中的位置或视角。
    因此,如今神经生物学和计算机科学之间展开了许多有益的合作,两个领域相互促进。大脑是不是用神经网络来解读世界的呢?大脑是以“机器学习”的方式来工作的吗?答案似乎是肯定的,而且大脑做得比计算机好得多。毋庸置疑的是,计算机在很多任务上做得很出色——不仅仅是下棋,还能学会其他更复杂的任务。然而总的来说,人工智能计算机还是只能在某些方面表现突出,而且即使是最简单的人工智能也需要许多硬件支持,需要许多能源。与之形成鲜明对比的是,我们小小的脑袋只需消耗一盏小夜灯的电量就可以做更多的事情。从这个角度看,计算机是非常糟糕的大脑,而计算机科学的目标之一就是把计算机变得更像人脑。机器学习的关键,正如赫布所想,在于固定连接的神经网络有很多事情不能做,而连接神经元的突触(或者说是计算机里的模拟“神经元”)能根据经验修改。这种可塑性不仅存在于感觉系统里,而且是整个大脑通行的规则。可塑性让大脑能从损伤中修复,还能让大脑把资源分配给最重要的任务。在大脑中,神经网络可以学着去预测世界中有什么物体,它用过去习得的知识来辅助识别视网膜输入的原始信息。总而言之,这意味着感知不仅仅是对视觉图景的固定响应,而且是习得的。大脑的神经网络在看到视觉特征的特定组合时能认出它们。
    机器学习能完全模仿人的视觉回路吗?

机器学习是时下的热门话题之一,但实际上,电脑并不一定能有人脑做得更好。 /pic/5_twrJypbTu9aY4AqdFSHqb0NvL3PBJw.jpg在面部识别方面,人工智能还有很长一段路要走(图源自网络)
举个例子,图灵测试是一个验证机器意识的著名测试。你可以尽你所能造一台最厉害的计算机,训练它像人类一样思考。随后,你站在机器外面和它对话。如果你不能分辨和你对话的是一台机器还是一个活生生的人,那这台机器就通过了图灵测试,你可以认为它是有意识的了。 《我们如何看见,又如何思考》的作者理查德·马斯兰认为图灵测试是皇帝的新衣,因为人体的意识回路是极难用机器复制的。为什么这个测试可以说明机器有意识呢?它还是一堆硅芯片而已啊。 马斯兰在书中提出了一个老问题:我们的意识是什么,在哪里?“自我”又是什么、在哪里?我们大多数人觉得我们的自我好像存在于脑袋中央、眼球后方的不远处。有没有可能是这个“自我”解决了大脑的结合问题呢? 这个自我可以把视网膜发送来的、所有肢解过的视觉图像以某种方式粘贴在一起,形成一个单一的物体图像。但如果我脑袋里有个小人,占据我个人宇宙的中心,它又是怎么由一团柔软的大脑组织产生的呢?这不仅仅是我,我们所有人都有一个“我存在”的主观感受。但这个存在是什么、在哪里?亟待我们回答。
对于我们理解感知、思维和情感的实际体验,这意味着什么?我们没有明确的答案,但是我们可以想象远处的答案大概会是怎样。已知的、已验证的科学知识可以给我们以切入点。我将带你们走一小段路,看看感官体验是怎么变成感知和思想的。最后,这一切中的“我”在哪里? 当我们从外部看大脑时,谈论大脑很容易,但是我们想象中的内在的那个自己在哪里呢?这个问题我们几乎无从下手——我们陷入了意识的本质,即自我问题。我们将在本书的最后讨论这个问题,我没有答案,只是试图带你更清楚地看待这个问题。

/pic/6_UOTfOWs7TYOLGiajSQRib9gia0K8ZQ.jpg
更多阅读40位神经科学家,35个大脑故事:爱情是一种本能的力量吗模仿人脑视觉处理,助力神经网络应对对抗性样本

黄小骑2021-08-17 10:01:35

原来作者已于2019年去世,这是他最后一本书。赞 1