打开人类行为的黑箱究竟有多复杂
编者的话:深度学习中最常见问题之一就是模型缺少解释性,也就是你不知道你这个模型为何会得出这样的结果。这是一个很本质上就难解决的问题,之所以这么说,是因为深度学习本就是师法自然的进化机制,那么我们不妨去看看,经过了百余年数不清的科学家的研究,我们对于人类行为这个黑箱,究竟打开了多少?
今天介绍的长文来自于Tiny,讲述的是当我们讨论“行为遗传学原理”时,在讨论什么?
行为也可以说是现象。我们对复杂的生物行为这一现象加以理解,试图去认识自我和他者,进而更好的寻求意义和适应这个世界。在科学的范畴内,现象的解释需要理论。理论的建立,粗略的讲,先是基于对现象(事实)的观察,通过归纳发现事实的规律,并对这规律用更一般性的语言进行描述和概括。由此而来的理论便可以用作 “解释” 的工具,但工具好不好用,要看它们是否会被事实验证,不能被事实验证的“理论”顶多算得上假说。因为理论之所以能成为理论,重在它出于现象之后的生命力(张五常先生说的是解释力),这一生命力的表现则是它可以不断延展,解释尽可能多的现象。所谓“青出于蓝而胜于蓝”。
正如张五常先生说:“ 事实的规律只可以使我们知其然,不能使我们知其所以然……以抽象思想或概念为起点的科学理论,“非真实”是需要的,因为事实不能自作解释。“不可能太详尽”与“简化”——这些是容许的。但验证条件与真实世界拖了节却犯了大忌……模糊不清的概念或分析,不可能被清楚地证明是错,因而没有解释力。”
遗传学正是用来验证理论的“事实”——被实验验证了的知识。当然,遗传学是传统的说法,即所谓的经典遗传学。涉及到目前的研究进展,我们可以更宽泛的表述为分子生物学范畴。从行为遗传学的角度,它们要验证哪些理论?即用来解释生物行为的理论,如进化假说。
生物中的进化现象并不是达尔文提出的。早在古希腊时代,类似演化的思想就已经出现,到18-19世纪,欧洲已经有许多关于生物进化的思想,拉马克是第一位提出进化机理的人——用进废退和获得性遗传。只是被大家普遍接受或争论的是达尔文提出的关于适应性遗传的自然选择机制。而关于这一假说的争论也诞生了一个新的学科——进化生物学。在这一学科的发展中,不断有人对自然选择机制提出质疑和修改,并建立新的理论和模型。随着细胞学和遗传学的建立,达尔文理论里关于遗传、变异的机制被否定,出现了新达尔文理论。
新达尔文理论一词是德国动物学家奥古斯特.魏斯曼(August Weismann 1834-1914)提出的,他的重要贡献在于提出了“种质论”,即生物体是由种质和体质组成。前者是生殖细胞,后者是体细胞,新物种的形成是由生殖细胞产生,二者不能转化。魏斯曼同孟德尔和摩尔根是当代遗传学的奠基人。
而到了20世纪20-40年代,遗传学家杜布赞斯基,鸟类学家恩斯特.迈尔(Ernst Mayr)、数学家罗纳德.费雪(Ronald Fisher)、生物学家莱特(Sewall Wright)与霍尔登(JBS Haldane)等人把群体遗传学引入进化研究中,被称为“现代综合理论”(又升级换代了)。
个人肤浅的认为新达尔文理论和达尔文理论并没有什么本质区别,只是在孟德尔以后添入了很多遗传学知识和名词,比如由模糊不清的“生物变异”换成了“基因突变”(但谁知道基因突变到底在说什么?)。新达尔文理论是近80年的主流进化理论,概括起来是说新物种产生的进化机制是基因突变和自然选择的结果,后来又增添的一些新的理论如:地理隔离,中性突变,环形种等等。但这些理论还基本划分为一大派系,即它们认为进化是在长期的积累过程中渐进产生的。
与这一派系形成对立的是由美国古生物学家N.埃尔德雷奇(Niles Eldredge)和S.J.古尔德(Stephen Jay Gould)于1972年提出的“间断平衡理论”。在这一理论提出之前已经有植物学家发现大量的新物种产生是一代完成,如月季草。加上古生物学家们对缺乏“中间化石”的提出质问,他们认为生物进化或新物种的出现以跳跃的方式快速形成;新物种一旦形成就出于保守或进化停滞状态,直到下一次物种形成。还有一些非主流的进化机制假说这里就不过多赘述。
总之,达尔文理论可以说是人类有史以来最有争议的科学理论之一了。信奉者着它的人称他为最伟大的科学家,他的理论称为最伟大, 最美丽的理论。但这一百多年的科学发现和争执中包含着很多自相矛盾的理论甚至有些可以说只是科学的想象。也由于主流科学界的诡辩和玩弄文字游戏,发展至今它似乎已成为没有错误可能的套套理论(循环理论a=a)。实际上,又有多少人了解什么是达尔文理论和新达尔文理论的含义和内容呢?绝大多数人不过是在上生物课听老师讲过达尔文理论,加上主流的媒体和科学界吹捧,就听之信之,人云亦云罢了。对于大多数人来说,自然选择的含义就是有些生物适应自然环境,有些生物不适应自然环境,适应自然环境的生物能存活,不适应的便被淘汰。也许连物质缺乏,生物之间相互竞争这层理解也没有。但这并不是达尔文本人对自然选择的定义。
下面达尔文讨论的自然选择的五个步骤:
1) Traits are variable.
2) Traits are heritable.
3) A geometric progression so that population soon exceeds food supply.
4) As species always breed beyond available resources, favourable variations would make organisms better at surviving and passing the variations on to their offspring, while unfavourable variations would be lost.
5) Evolution in populations, the result of this would be the formation of new species.
As he later wrote in his Autobiography**:**
In October 1838, that is, fifteen months after I had begun my systematic enquiry, I happened to read for amusement Malthus on Population, and being well prepared to appreciate the struggle for existence which everywhere goes on from long-continued observation of the habits of animals and plants, it at once struck me that under these circumstances favourable variations would tend to be preserved, and unfavourable ones to be destroyed. The result of this would be the formation of new species. Here, then, I had at last got a theory by which to work…"
即便是清楚了达尔文理论,接下来还要问——当我们在讨论“基因突变和自然选择”时,我们在讨论什么?
生物进化理论关键要解决的问题:一个物种是如何产生的。在进化生物学中,大家普遍在讨论基因突变和自然选择。但从实证科学的角度,我们需要弄清楚的是基因如何突变、在哪里突变?什么是自然选择、何为自然、如何选择?自然选择作用的对象是什么?从基因的突变到性状的产生、行为的变化最终新物种的形成的中间过程是什么?遗传的物质基础在哪里?这些理论中的抽象概念研究进化的生物学家们能否用事实验证?你要告诉我选择假说吗?比如从自然界观察到的个体选择、性选择、亲戚选择和互惠利他行为?但真正的科学家会同意,事实不能以事实解释,“真实”有多种意义,若搞不清楚是哪方面的,争论就永无止境了。
“在科学的范畴内,问题来来去去只有一条:为什么? “怎么办?” 是工程学的问题,而“好不好?”则是伦理上的问题了。” 这也是张五常先生说的。
当一个学科能给出的解释穷尽时,另一学科就会兴起。科学的解释不能仅是天马行空的想法,如果你没有更好的解释,我就在科学的解释上击败你,甚至是完全藐视,这就是分子生物学观点的建立和开端。接下来,我们便开始讨论分子生物学是如何解释基因突变、适应性,以及渐进理论和间断平衡理论的。
对于混杂的进化理论,分子生物学家要理清头绪弄明白当性状发生改良时的进化机制。首先要提出的问题是:“进化发生改良的必要条件是什么?” 由此问题便集中到了对“基因”的研究上。下一个问题:“当我们谈论基因时,我们在谈论什么?” 这便走到了关于遗传物质DNA的发现和结构的证明之路上(沃森和克里克于1953年提出DNA的双螺旋结构,并于1962年同富兰克林三人共享诺贝尔医学奖)。接下来要问的是:“由基因到性状如何实现?” 对这一问题的回答,我们知道所有关于基因的概念若要跟行为连在一起需要借助蛋白质这一中间媒介。蛋白质之所以在我们的日常饮食中如此重要,是因为它是细胞功能的劳动力,使生物体按照既定的功能运转(想想我们常说的酶、神经递质、信息素、各种激素,都是蛋白质)。
蛋白质如何被编码(合成),这是基因被引入的地方。(接下来是枯燥的生物学基础知识,但既然是基础就很重要。)
DNA双螺旋结构的发现标志着分子生物学的开始。1955年F.桑格完成了胰岛素的氨基酸序列测定,在此基础上提出的中心法则,即遗传信息从DNA到RNA到蛋白质的生成过程。绝大多数DNA存在于细胞核内,少量存在于线粒体内。DNA本身并不直接参与细胞功能,它是通过指导合成蛋白质的方式来发挥自己的功能。蛋白质是由20种氨基酸组成。
DNA,也就是 “脱氧核糖核苷酸”,它是一种长链聚合物,基本单位成为核苷酸,有四种不同的核苷酸。这些碱基沿着DNA长链所排列而成的序列,组成遗传密码子。根据DNA序列复制出一段成为RNA的核酸分子。RNA有三种,而决定蛋白质中的氨基酸顺序和组成的是mRNA(tRNA、rRNA),它是以DNA为模板合成而来,这一过程称为转录。
mRNA分子中每相邻三个核苷酸成为一组,这三核苷酸决定了一种氨基酸,三个位点在一起叫密码子。密码子延伸的过程就是蛋白质的合成过程,称翻译。每一个位点有四种可能的核酸,那么三个位点就会有64(4x4x4), 即64个密码子,却对应20中氨基酸。这意味着有些氨基酸有多于两种的密码子。(这里便可解释进化论里的正向突变和中性突变一说)
按照中心遗传法则(后来因RNA病毒和逆转录酶的发现被修正,但对绝大多数生物还是适用的),如果得知DNA序列,就能得到mRNA序列、氨基酸序列和多肽序列,进而蛋白质的三维结构也可获知,最终由蛋白质的结构决定功能。蛋白质会迎合功能造成自身结构的变化。基于这个理论框架,如果DNA发生错误编码会怎样? 微小的编码错误会有什么后果?DNA分子中的核苷酸以一定的速率改变,一般是每一百万或十亿个核苷酸就一次突变。如果单分子中的一个碱基突变了, mRNA也会随之改变,密码子序列也会改变,对应的氨基酸可能会改变,蛋白质结构可能改变,最终功能就可能变化,蛋白质的工作质量和效率就会改变。对应的我们最终可能观察到性状和行为的改变。
对于突变的进一步讨论,我们还可以看到产生变化的程度。生物学上三种经典的DNA突变类型(点突变、删除突变、插入突变)。为了更好的理解,我们可以想象DNA将遗传信息传递到蛋白质的过程就像语言信息的表达。特定字母的组合连在一起可以传达信息,如果字母改变、增加或缺失整条信息就可能发生变化。“ I will now do this” 发生点突变后是 “I will not do this ” 删除突变是” I will nod ot his ” 插入突变是 ‘’I will now wd othi’’ 。
当你了解了事实的真相后,有些理论会被验证,有些就会分崩离析。分子遗传学的研究也让我们理解某些疾病的发病机理,如苯丙酮尿症是因为分解苯丙氨酸的蛋白质编码发生突变导致其功能的丧失,致使苯丙氨酸浓度积累损害神经系统严重的导致毫无生殖能力。你还可以理解为什么不同人的焦虑程度不同,研究发现这正是与大脑中控制焦虑情绪的蛋白质有不同程度的突变有关。
当然,分子层面的经典遗传学不是为了解释疾病而是要证明个体差异的存在。将这些变异转化成进化论中的概念,从分子生物学的角度看,就会知道要指向哪里。这能帮助我们理解经典渐进理论:由于变异我们有了多样性,我们的适应性不同,就产生了微小的优势,这优势是由于蛋白质的微小形态差异造成的,自然选择在长时间内改变形状分布,那个具有微小优势的形状会在种群中变得越来越显著,还说明变化是一点点发生的,每一点差别都至关重要,发生在基因上的一点差别经过多代复制产生巨大差异,差异逐渐递增。
理论有用,还要看如何正确的用。它给你在进化史上回溯的基础。但如果用于支持政治观点——竞争无处不在而引发的战争,那些社会达尔文主义者甚至是马克思主义者便要小心对待了。
间断平衡理论某种程度上看与马克思的辩证唯物主义有些契合,而提出这一理论的古尔德除了是一位古生物学家也是一名马克思主义者。但不管怎样,我们的重点放在讨论间断平衡理论的科学解释上。这一理论刚提出时受到主流进化论的抨击,反驳的观点一方面是强调不同研究领域选取的时间度量标准和研究对象都不一样,同时也批评古生物学家是对找不到“中间化石”的推托,更重要的是他们缺乏分子生物学的阐述机制。
但分子生物学的不断发展,让我们对间断平衡理论有了新的认识。
对遗传信息传递的进一步研究发现,在真核生物里用来编码蛋白质的DNA序列并不是连续的,而是一段一段间隔的。能编码的部分称为外显子(exon),不参与编码的部分称内含子(intron)。在DNA变成RNA的过程中,叫作剪切酶的蛋白质负责把每段外显子减下来,剪切酶的好友连接酶负责把这些外显子按顺序再连接起来。同时这种连接又是随机的,比如一个完整的基因上有三段外显子(abc),最后连接的可能组合就有七种(a\b\c\ac\bc\ab\abc),剩下没有参与组合的由另一同伴降解酶负责清除。这便是由Baltimore提出的基因结构的模块化基础。
基因结构的模块化能让我们理解什么?首先,不是一个基因对应一种蛋白质,而是一系列蛋白质。进一步的研究发现,生命中的不同时期、不同场合,在不同的个体体内,在身体的不同部位,剪切酶和降解酶的工作方式会有差别。从而造成同一个基因在身体的不同部位生成不同种类的蛋白质。
基因构成的模块化基础的另一个隐含信息是: 基因很少在结束编码后接着编码下一个,中间有很长一段序列根本就不被基因编码,这95%的碱基序列都是垃圾吗?当然不,它们是基因的调控序列(指令集)。指令集给出指令什么时候启动这些基因,它们是基因的开关,来决定基因什么时候被激活、转录和翻译。在这个过程中重要的蛋白质——转录因子被发现,他们是启动开关的关键角色。这直接说明之前的观点是错误的,DNA要受限于其他物质。在这个过程中,DNA并不知道自己干什么,是外界的调控因素在起作用,这立即让生命现象变得更为复杂。转录因子进入系统,不是启动单个基因的转录,而是启动一系列基因链的转录,从而编码出一系列功能相似的蛋白质。
由于DNA中95%的调控序列,有关DNA最有趣的事情不再是蛋白质形态和功能,也不是蛋白质的工作效率,而是什么时间、在什么环境中蛋白质发挥作用。外界的一些变化调节基因的变化。有人说基因是遗传的中心,是信息的来源,但细胞内外其他地方的事件,甚至是宇宙中发生的事情,决定基因什么时候被激活,我们看到的是一个更有趣的世界——在这个世界里基因表达受环境调节。如果受到细胞内葡萄糖浓度低的信号,那么细胞内就会制造帮助运进葡萄糖的蛋白质,如果闻到了幼崽的气味,相应的启动另一套机制。这些反应不是直接改变蛋白质性状,而是改变环境。我们会发现研究环境比研究蛋白质性状有趣的多。如果这个蛋白质在不同的时机或不同的场合被表达,这种情形有趣的多。
外部机制在运作:基因的模块化结构和外显子、内含子,以及基因受环境调节的种种情形,基因转录被启动或关闭,完全不同的情形,你能产生完全不同的蛋白质,这些蛋白质产生的差异远非微小可以形容。
分子生物学领域的开辟远远不止这些,科学家们还发现了另一层面的调节——染色质。为了维持其稳定性,DNA被特殊的结构蛋白包裹着,一种新的调控变成了重要问题:转录因子是否有能力到达DNA并结合上来起作用。转录因子接近DNA执行其功能,需要告诉染色质什么时候该打开或关闭。究竟要如何调控?你可以做一些改变,这些改变是对染色质做特定的修饰(分别在DNA和组蛋白上),比如甲基化修饰,而甲基化的过程就可以让DNA和结构蛋白结合的更紧密,即染色质关闭,从而可能导致大段染色质上的基因沉默。这种基因沉默便是通过改变转录因子的透过性来达成其目的。
当我们开始逐渐了解分子层面的遗传物质基础和调控时。便可以重新思考突变、转录、进化之间的关系?想想看,如果剪切酶发生了变异为怎样? 如果变异发生在转录因子上又会怎样?如果变异没有发生在编码基因的碱基上而是编码启动子的碱基上后果会怎样?这时,你就能看到一个全新的系统,结论并非纯粹的渐进理论能够解释的。这时,我们也许可以将目光转向间断平衡理论。但不管是渐进理论还是间断平衡理论,我们仍有太多“为什么”要去问。
基因结构模块化的发现,推动了又一新学科的诞生——表观遗传学。简单地说,遗传研究的是DNA序列,表观遗传研究的是对DNA可访性的调控,整个表观遗传学领域控制着转录因子的性质和效能。正如有人说:“受精是遗传学的事情,发育是表观遗传学的事情”。
也正因为表观遗传学的建立,让我们重新思考环境对基因和行为的影响?所谓那些可以起到影响的环境是什么?它可以是细胞内物质水平的变化,细胞之外各部分身体组织之间的相互调节和影响,再到个体之外,各种自然的、社会的、文化的环境因素的影响。通过这一层层的环境作用于我们的基因,最终反过来调控我们的行为。这能带给我们太多的思考。
举个简单的例子。不同的养育行为会造成子代染色体的永久性改变,有些改变发生在与应激激素相关的基因上。这意味着什么?已有实验研究表明,母鼠舔舐子代的频率以及其他不同的养育习惯会改变子代体内一些基因被激活的条件,最终发生变化的基因有六千之多。生命中幼体时期发生时间的分子原理,影响深远,很多类似情况或许是可逆的,但更多的是不可逆的,影响个体一辈子。这些影响可以是无关紧要的生物性状,但如果是影响到某些致命的性状呢?又或是性格和意识上的呢?
这是理智带给我们的思考。
原创不易,随喜赞赏
更多阅读
跨学科系列讲座:体验、经验、实验 (陈嘉映) ——个人总结与反思
参考资料:
1)《达尔文的妄想:一个“伟大”的科学笑话》第二版,张坚一
2) 《经济解释卷一,科学说需求》神州增订版,张五常
3)《物种起源》第二版,达尔文著,苗德岁译
4)《Principles of Behavioral Genetics》, Robert R.H. Anholt & Truudy F.C. Mackay
5) Behe, M.J. (2007). The edge of evolution: the search for the limits of Darwinism
6) Coyne, J. A. (2009). Why evolution is true. Oxford;
7) Darwin, C., T. H. Huxley, et al. (1983). Autobiographies.
8) Montagu, A. and I. Asimov, Eds. (1984). Science and creationism. A Galaxy book.
墨者|3.02018-01-28 18:18:15
拿着铲草的锄头想解开中央银行安保数据库。
Ca.2017-11-11 00:14:33
我也思考过这个问题。遗传,究竟是什么呢?它真的很重要吗?人的性格由遗传和环境共同作用,环境造成的影响又会影响下一代吗?我觉得可能需要更多的时间才能解答。等我以后研究神经吧( ‘ω’ )赞 1