后真相时代的源头早在1980年?—PNAS论文探讨集体语言的理性衰落

导读:语言是外显化的思维,各种风格的词汇背后往往暗含着各种思维习惯。是否可以对大型语料库进行统计分析,来量化、可视化人们思维演变的过程?近日,PNAS 发表的一项最新研究“”,利用谷歌 nGram 数据分析了1850年以后数百万图书数据中的词汇使用,结果发现,和感情有关的词语使用系统性地减少了,而与理性论证相关的词语使用稳步上升。这种语言理性衰落背后的原因是什么?与社交媒体时代的到来是否有关?本文结合数篇相关研究,深入探讨了这一问题,并结合认知极化的相关研究讨论了可能的解困之道。
/pic/1_667q4Sqqk0FEiaw52zMZFV7LsJZ81A.jpg

摘要:
研究领域:认知语言学,集体思维,认知极化论文题目:The rise and fall of rationality in language论文链接:https://www.pnas.org/content/118/51/e2107848118 /pic/2_XgyjIibk3HbHicarsY8zpey8NxTicA.jpg 论文题目:The rise and fall of rationality in language论文链接:https://www.pnas.org/content/118/51/e2107848118

观其言,知其行。一个人习惯说,我们总结得出**,另一个习惯说我觉得***,前者更偏向于集体主义和理性的思维方式,而后者习惯个人中心的感性思维。由此,可以考察语言记录中,不同类型词汇出现的频率随时间的变化,来描述群体思维方式的改变,从而为“后真相时代”找到其出现所依赖的更基础的社会背景。
新研究数以百万计的书籍中的语言使用,指出1850年以来,与理性相关的词语,在英文及西班牙文书籍和报纸的使用频率呈上升趋势,但在1980年左右,趋势反转开始加速下降。这一发现意味着,人们对事实和理性论证的兴趣丧失,早在社交媒体兴起的几十年前就已经开始了。这一发现指出事实真相在公共话语中越来越不重要,并不是偶然事件,而是早已开始的风潮的一部分。
/pic/3_DKCKT4Uibdy75PwMSDcGkNRmnIdI5w.png 和理性有关的词汇,例如分析,数据,限制,结论,系统大小等(上图)早1980年出现频率达到顶峰,之后一直下降,而与直觉相关的词汇,如想象,智慧,相信,感觉等则在1980年的频率显著上升作者指出,随着社交媒体的兴起,2007年左右,书本语言从理性向情感的转变加速了。当时,与事实相关的词汇频率下降,而充满情感的语言则激增。类似的,群体的语言使用习惯,也在近40年间,从集体主义转向了个人主义,这反映在单数与复数代词如“ i”/“ we”的比例上,如下图所示:
/pic/4_SgKrEjiabQESIC5AIXOrboXeyP5cAA.jpg 个体和群体的代词出现相对频率折线图,1980年后,各类文本中,指代个人的词汇比例都显著上升
为了更严谨的论证,研究区分了虚构的小说和事实类的非小说,发现相同的趋势在两类中都会发生。此外,在《纽约时报》的文章中,也观察到情感和理性标志词之间,呈现相同的变化趋势,这表明分析的结论与书籍这一语料库无关,而是反映了更深远的趋势。
/pic/5_iakGH3kVZZbTdujotnbka4cnXMouaQ.png 不同词汇在书籍中出现的频率,和当年谷歌搜索数据的变化,呈现正相关
为了说明书籍中不同类型词汇频率的变化,确实反映了大众真实关注点的改变,研究者对比了2004到2019年间,不同词汇频率变化趋势和同年份谷歌搜索量的相关性,相比随机数据(灰色),代表真实数据的蓝色柱子意味着两者之间呈现正相关,这说明可使用书籍中词汇的变化,来研究更长时间跨度下,群体思维习惯的改变。
“推断1850年至1980年的长期模式的驱动因素,这只能是猜测性的。该研究作者指出的一种可能性是,科学和技术的迅速发展及其社会经济效益推动了科学方法地位的提高,这种方法逐渐渗透到文化、社会的方方面面,例如各类教育和政治的机构中。正如马克斯 · 韦伯早期提出的那样,随着唯心主义在现代化、官僚化和世俗化社会中的作用逐渐减弱,这可能导致了一个‘祛魅’的过程。
又是什么原因导致1980年前后长期趋势出现逆转,这一点或许更加难以确定。作者认为,可能与1980年代以来,经济政策变化引起的收入差距增大有关,经济增长的背后是新技术,但成果却只留在了少数人,这一矛盾导致大众对理性的信任降低。社交媒体的兴起,带来的回音室效应意味着感性的语言模式比理性的有更大的机会获得关注,也加速了理性词汇的衰落。随着阴谋论,标题党在社交媒体的流行,更是专门针对权威机构和其呈现的理性客观的思维模式进行批判。
作者在该论文的结尾指出:“无论驱动因素是什么,后真相时代的到来,与我们两种基本思维模式(推理和直觉)之间的平衡中有关,如果推理这种思维模式,在大众中的影响真的是在持续减弱,那么这预示着公共传媒中看到的乱像很可能是不可能逆转的。对此,社会可能需要找到一种新的平衡,明确承认直觉和情感的重要性,同时充分利用亟需的理性和科学力量来处理诸如全球变暖,疫情防控等各种复杂的问题。”
理性和感性平衡的重要性,体现在今年2月的一篇PNAS论文中,该研究指出,私人的体验,相比冷冰冰的事实,在讨论争议性的话题时,例如持枪,堕胎,能够更好的赢得持相反观点的人的尊重和理解,从而建立共识,减少极化。但同时也要认识到,个人的经验容易被误用,例如过度诠释,选择性关注,不适合探讨复杂的话题。
https://www.pnas.org/content/118/8/e2100280118
无独有偶,PNAS今年8月的论文“历史中的语言记录指出数十年间认知扭曲的激增”,调查了过去 125 年里,英文德文和西班牙文的超过 1400 多万本书中,和认知扭曲有关语句的频率,发现自 20 世纪 80 年代以来,认知扭曲的文本激增,甚至超过了大萧条和两次世界大战期间的水平。
https://www.pnas.org/content/118/30/e2102061118
所谓认知扭曲,指的是以一种过度消极和不确切的方式思考自己、世界和未来。具体的表现是“灾难化”、“二分法推理”、“否定积极”,“过渡概括”,例如当人们用消极的、绝对的术语(例如,“我是一个失败者”)给自己贴上标签。这些认知扭曲与个人情绪、行为和语言的显著变化息息相关。患有抑郁症的人,最容易出现这样的思维方式。
/pic/6_anyvzEwM35qAhgMZqicmSnibdicCqg.jpg 三种语言中,经过认知科学家标注的代表认知扭曲的语句出现的频率随时间变化图,1980年之前,英语中大萧条时期认知扭曲出现的最多,德语是1946年战败时频率最高,但在1980年之后,三种语言都出现了认知扭曲比例的显著增加。
除了认知扭曲,与后真相时代密切相关的另一个现象,则是过度自信,两者看似相反,实则都反映了理性影响力的衰落。而今年10月的PNAS论文:“人们错误地将互联网中的知识当成自己的”,通过6个实验,发现搜索引擎的普及,使得大众普遍认为自己知道的比实际多得多,当信息触手可及时,我们可能会错误地认为它来自我们的大脑,从而对自己的思考和记忆能力也更有信心,而当互联网不再可用时,则会呈现虚假的过度自信。而这也可能成为对认知失调及情绪相关词汇激增的一种可能解释,即长期依赖外部知识带来的对自身认知能力的误判。
https://www.pnas.org/content/118/43/e2105061118
将两篇使用语言记录研究社会心理的研究结合来看,首先说明了基于书籍报纸的文本频率,可以研究社会学中群体心理和认知模式的改变,这可能为定量研究重要的文化和语言动态提供了一个独特的机会;但同时也要认识到在验证假设和测试基于这些数据得出的关联的因果机制方面,这类数据存在一定的局限性。未来的同类研究,可以考虑文本间的相互关系,例如不同年份的影视剧剧本,可以通过继承关系建立关系网络;或使用词向量等自然语言处理方法,来研究更微妙的变化趋势。
从两篇文章的结论来看,是相互支持的,认知失调是感性思维完全压倒理性思维后的极端现象,而两者作者都各自推测1980年后的变化,和贫富分化加剧,及社交媒体兴起有关,是更大范围社会现象的一部分。这意味着社会学研究要将其发现放到一个更大的视角下去审视,如此才能提出建设性的建议。例如不是去逆转理性衰落的趋势,而是找到新的方式去平衡直觉和推理这两种思维方式。
而对于科学传播者来说,在后真相时代,只要连续点击率和高收视率继续产生丰厚的利润,并为广告商提供数据来源,只要亿万富翁愿意并且能够花费大量金钱来保护他们的政治和经济利益,媒体所有者和管理者就很少有动力改变他们的算法或编程内容。这样的大趋势,一种应对方法是以感性的,甚至是低幼的方式去传播科学发现,而更好的方式,则是让科学家及其科学协会预测错误信息和虚假信息的活动,并主动制定在线策略和互联网平台,以在它们发生时予以抵制。
更多阅读从认知和逻辑思维的角度谈谈自然语言理解
The most human human读书笔记-谈谈语言,人性还有人工智能
《别想那只大象》书评 语言框架在分析复杂问题时的锚定效应