过早尝禁果的危害竟然包括心血管疾病风险增加?真相并非如此

科普新闻中,常常会出现某种生活习惯会带来健康风险这样的结论,例如吃红肉会增加患上癌症风险,久坐着看电视会增加心血管疾病的风险。
然而细究这样的研究,大部分其结论是基于两个变量之间存在相关性,然而相关性不等于因果性,例如游泳溺死的人数和吃冰激凌人数之间存在相关性,然而两者间显然没有因果关系,而是由共同的原因-“夏天”造成的。
然而,**科学家真正追求的并不是相关性,而是因果性,**只有找到的从原因到结果的链条,才能够通过精准地干预,阻止不愿见到结果发生。
/pic/1_YYxNsE3rBX6nU4x0g5XrfTd6Sm4CAA.jpg
为了找到潜在的因果关系,荷兰科学家Martijn Katan于1986年提出的一种名为“孟德尔随机”的分析方法,能够使用基因测序数据,找到生活习惯和疾病风险之间的因果关系。
但即使是如此找到的因果关系,也不并没有排除所有其他的可能性,意味着两者之间不一定百分百是由于A,而导致B发生的。下面会通过一个有趣的例子,讲述何为孟德尔随机,通过论述上述观点,让读者明辨因果性与相关性的不同之处。
2020年1月7号的Nature子刊人类遗传学中,在一项基于6194名心血管病患和4287名正常人的控制组的研究中,研究者想了解那些生活习惯,和心血管疾病的发病风险有关。结果发现了第一次啪啪啪的年龄竟然和心血管疾病风险有关,首次啪啪啪的年龄越早,心血管疾病的风险越高,而且这一风险的影响程度,在包括吸烟,看电视时间等生活习惯中排名第一。最重要的是,俩者之间还是因果关系。
/pic/2_pjOOzQsiblTV9hYcVew9Amo175d7GA.jpg https://www.nature.com/articles/s10038-019-0716-z
说明A和B之间存在因果关系,是一个比这俩者相关困难的多的事情。要证明因果关系存在,就要论证如果没有这样做,会发生什么。传统的做法是进行长时间的跟踪,通过随机双盲实验,判定因果关系是否存在。但孟德尔随机法不需要这样,实验者只需要在一个时间点进行观测就行。
孟德尔以豌豆为人所知,在下一代的豌豆中,各种性状的出现是无法预知的,决定豌豆是扁还是圆的基因型也是如此。父母的DNA在通过减数分裂,形成生殖细胞并传给子女时也会随机进行分配。
老天在决定那个小蝌蚪是幸运儿时,蒙着眼睛,不会说导致某个特定性状的基因有额外的优势,即基因变异体与环境因素随机且独立分离。再加上基因不会随文化、经济等因素改变。如此就相当于在出生的时候,老天将人随机分成了俩群,仿佛一个天然的随机对照实验。
/pic/3_7XeQ4Jck3sdYaJprYcjmp5fRkyIiaQ.png
现在我们要确定首次啪啪啪的年龄和心血管疾病的风险,要做的就是进行基因测序,获得了病例组和控制组的基因型。我们找到了一个基因突变,和首次啪啪啪的年龄早相关,又找到一个变异,发现和心血管疾病风险高相关。结果一对比,bingo,造成这俩的基因突变竟然有很大一部分是重合的,由于你的基因不会由于你年轻时啪啪啪就改变,也不会由于患高血压而改变,因此研究指出,俩者之间有可能存在因果关系。
之所以说这只是可能的因果关系,是因为孟德尔随机的假设是基因变异不能和从A到B的因果链条中的其他因素有关。假设爱冲动的性格导致了啪啪啪的年龄早,同时又能导致心血管的风险增加,那爱冲动就是从啪啪啪过早到心血管疾病风险增加这一因果链条中的混杂因素。而若是前文找到的基因突变正好是决定是不是爱冲动的,那这就说明啪啪啪和心血管风险之间没有因果关系了。
大量行为遗传学的研究表明,人的心理特征与遗传密切相关。因此,这篇论文的英文标题的用词,是“causally associated”,而不是“causally linked”,前者表示对因果关系的确认程度要比后者轻,前者指存在因果关系的可能性,后者则确定俩者之间存在着因果关系。这是科研论文严谨性的体现。
啪啪啪过早和心血管疾病风险存在因果关系,是一个超乎寻找的论断,超乎寻常的论断,需要非同寻常的证据。因此更要排除所有潜在干扰因素,所谓“君子畏因,小人畏果”。因果关系的判定要慎之又慎。
对这一潜在的因果关系,更有可能的一种解释是有一个共同的特征,导致了俩者共同出现。该文的研究者将研究中用到的表型,俩俩之间逐个计算相关性,发现首次啪啪啪的年龄,和吸烟状况正相关,除此之外,该指标还和是否完成高等教育负相关,和夏天是否经常外出活动负相关。也就是说啪啪啪越早的,都是不爱出门的坏学生。
但这就是全部的真相吗?在该文的讨论部分,研究者将首次啪啪啪年龄和心血管疾病的风险,归因于社会经济水平不同,也就是说,由于你生在富人家里,因此你受到好的教育,青少年的时候能参与更丰富多彩的活动,而不是只想着啪啪啪,所以导致了你在众多生活习惯上,比穷苦人家的子女更加健康,最终导致了很多年之后,富人家的孩子心血管疾病风险相比更低。只是研究者无法获得社会经济水平的直接数据,才用了教育水平,智力等容易观测的指标。
事实上,很多类似的研究,也难以排除社会经济水平的研究,例如在自然通讯的论文“Genome-wide association studies and Mendelian randomization analyses for leisure sedentary behaviours ”,同样是通过孟德尔随机,发现每天看电视超过1.5小时,会导致心血管疾病风险增加。
在西方发达国家,看电视多的大多数人收入较低,**因此心血管疾病风险增加的原因,更有可能是收入低造成的一系列生活习惯,**而不是因为数据中的随机波动,导致其中单一的某项,在这项研究中变得统计上显著。

过早尝到禁果的小伙伴终于可以放心了。说了这么多,这项研究,对人类预防心血管疾病有什么意义啊?难道是让保险公司在制定保费时,根据首次啪啪啪的年龄来收取额外的费用?恰恰相反,由于首次啪啪啪的年龄和心血管疾病的关系是由于社会经济地位造成的,因此不应该依此对不同的人进行区别对待。
脱离这篇文章描述的内容,未来大数据研究越来越多,会有数不清的相关性被发现。也许在申请学校,找工作时,你也许会由于某个你意想不到的回答而被判定为不合格,但这样做是不公平的,就像在上面的例子中,保险公司依据首次啪啪啪的年龄,增加你的保费一样。因此我们需要更多关注因果关系的研究,个人也需要猜亮双眼,厘清相关性和因果性之间的区别。
更多阅读**因果学习的三个层次** “找亮点:解决问题法,其实还是回归因果 论文速递-新冠死亡率的辛普森悖论,因果推断的一个例子

点击阅读原文,查看论文原文
阅读原文

黑而不伤2020-08-26 16:14:20

啥?穷人家的孩子早啪啪?[发呆]

Justin Liu2020-08-25 20:39:53

如果找到的是和social economic status相关的基因,那就有意思了。这里面一定会展现出历史遗留问题,因为家庭传统也是可以遗传的

易点云徐云龙2020-08-25 19:54:45

从首次啪啪啪的时间再到得心脑血管病的时间隔了有点远吧

星团骑士2020-08-28 14:37:16

难道不是富人家孩子活动太多更容易早啪吗

心理范儿2020-08-28 13:03:42

如果两者存在因果关系的话,那我大概200岁之前都不用担心心脑血管疾病的风险。

Daniel Paris 一弘2020-08-25 19:55:27

您的文章,经常是我的兴趣点。

慎独2020-08-25 19:15:55

奇怪为什么会有人认为首次啪啪啪和心血管疾病风险有关

王孝标2020-08-25 19:02:09

各种奇怪的知识