科学与艺术中创造力“巅峰时刻”的通用公式
以下文章来源于集智俱乐部 ,作者郭瑞东
[
集智俱乐部 .关注复杂科学与人工智能的最新进展、书籍资料、工具文献、交叉前沿等,同时也发布集智俱乐部、集智学园举办的各类讲座、课程等活动相关信息。
](#)
geng’dgengd
导语
在科学家、艺术家的职业生涯中,短时间内集中产出高质量作品是相当普遍的现象。创造性活动复杂而充满偶然性,可是“巅峰期”的出现或许有规律可循。9月13日,美国西北大学王大顺团队在 Nature Communications 发表论文,分析了艺术家、电影导演和科学家的职业生涯,用深度学习和网络科学方法构建他们创作成果的高维表征。结果发现,先在不同方向创意探索,再在特定领域专注开发利用的做法与巅峰期的到来密切相关。**
研究领域:深度学习,网络科学,高维表征,科学学
郭瑞东 | 作者
梁金 | 审校
邓一雪 | 编辑
> 论文标题:
Understanding the onset of hot streaks across artistic, cultural, and scientific careers
论文地址:
“巅峰时刻”、“黄金年龄”,对于从事创造性行业的人,例如科学家、作家、艺术家,应该并不陌生。在人生的某个阶段,灵感喷涌而出,作品质量极高。如果能发现“巅峰时刻”的形成机制,或许就能帮助提前识别出即将迎来巅峰期的新秀,有针对性地培养他们。可是,巅峰期的到来是否有规律可循呢?
1. 创造性活动中的探索和利用
我们可以想象有两位青年学者,一位看到身边的科学家多少年始终深耕在某一细分领域,最终迎来“巅峰时刻”,因而总结要想成功,需要在某一领域深入钻研;而另一位熟悉的大牛更换过不少研究方向,他的结论则可能是,先游牧式的广泛探索更有可能迎来属于自己的“巅峰时刻”。
哲学家以赛亚·伯林提出过一个比喻,狐狸知道很多事,能游刃有余应对变化;刺猬只知一件大事,并且专注于此。科学家弗里曼·戴森也曾用狐狸-刺猬型来划分不同类型的科学家,比如爱因斯坦是刺猬,恩里科·费米是狐狸。这些观点实际上说的是,狐狸精于对未知领域的探索(exploration),而刺猬则专注于对已知领域的开发利用(exploitation)。
探索风险往往更大,却能使个人在实验和搜索中超越现有能力范围,从而增加通过意料之外、来源迥异的组合得到突破性想法的可能性。利用是一种更为保守的策略,但可以让个人在某一特定领域积累知识,持续完善自身能力,并培养在领域内的声誉。
到底是狐狸还是刺猬型的风格更容易迎来巅峰时刻?是探索还是利用与巅峰期的到来更相关?
王大顺团队的最新研究发现,在艺术家、电影导演和科学家这三种职业生涯中,个人倾向于在巅峰期开始前探索不同的风格或话题,在巅峰期开始后则明显变得更加专注。巅峰期的出现似乎并没有与探索或利用哪一个单独相关,而是来自探索和利用的合力,先创意探索,再专注利用的做法与巅峰时刻的到来密切相关。
2. 自动建模,对作品进行高维表征
系统性的研究需要收集海量数据,并通过算法来避免研究者自身引入的认知偏差。该研究用到了来自2128名艺术家的80万幅绘画,出自4337名导演的7.9万部电影,以及20040名科学家的发表记录,分别代表艺术、文化及科学三个不同领域。
针对不同类型的数据,分析方法有所不同:绘画采用卷积神经网络;电影是对剧本使用词向量降维,同时对演员阵容使用复杂网络建模,之后通过自编码器降维;对于科研论文则是通过共引用网络的社区发现(community detection),来得到作品在多维空间中的表征。
图1. 对艺术家、导演及科学家,获得其作品的高维表征的方法示意图。拿到每件作品的高维表征后,就相当于有了一幅地图,可以按图索骥,找出风格相似的其它作品,并为艺术家/科学家/导演绘制职业路径,判断他究竟是狐狸还是刺猬,更关键的是,识别出在“巅峰时刻”来临前后,他的作品风格发生了哪些变化。
例如图2展示的,是抽象画家波洛克、导演彼得·杰克逊及诺贝尔化学奖得主约翰·芬恩的创作轨迹,可分为巅峰期前、处于巅峰期、巅峰期后。图中的每个点代表其作品,不同颜色代表算法对作品给出的标签。一段时间内作品越分散,说明创作者在这阶段更像“狐狸”,而聚集在一起的点则是“刺猬”的标志。
图2. 艺术、文化及科研领域代表性人物在巅峰期前和处于巅峰期的创作轨迹。(第一列)作品影响力随时间的变化,(右边三列)作品高维表征的可视化展示。###
3. 创作风格如何演化?
信息熵度量多样性
在对作品进行表征之后,接下来要做的就是找出一个统计指标来量化观测结果。该场景下,我们关注的是多个作品是不是彼此风格相近,可以用其在高维表征中的信息熵来度量,信息熵越大,说明多个作品越发风格迥异。另一方面,通过随机选择作品,可以生成1000位虚拟的画家/导演/科学家的创作轨迹,以此作为对照。
图3的结果表明,相比于虚拟创作者,真实创作者作品的信息熵在巅峰期到来之前更高,处于作品风格多样化的探索状态,而在巅峰期信息熵更低,处于风格更加一致的利用阶段。从而说明个人在巅峰期前倾向于探索,巅峰期中倾向于利用这一结论。
图3. 依次是波洛克、彼得·杰克逊及约翰·芬恩在巅峰时刻前(图d-f)和位于巅峰时刻(图g-i)的作品集信息熵(虚线是真实创作者这一阶段的值,实线是1000位虚拟创作者的作品信息熵分布)。可见巅峰期到来之前,真实值普遍高于模拟数据,处于巅峰期时恰恰相反。在更细时间颗粒上,创作者风格又是如何变化的呢?图4展示了创作者的作品信息熵随时间的演化。同样可以看到,在巅峰期前倾向于探索,处于巅峰期时倾向于利用。
图4. 依次是波洛克、彼得·杰克逊及约翰·芬恩在巅峰期前后(蓝线和红线)及模拟创作者在特定时刻前后作品信息熵随时间的动态演化。横轴表示时间,纵轴表示信息熵,由该时刻创作两件作品、该时刻前创作的最新两件作品、即将创作的两件作品组成的集合计算得出。创作生涯中从探索转向利用和巅峰期的到来为何如此密切相关?如果只有探索或者利用,情况又会是怎样?研究中将创作风格的转变策略分为四种:一直是探索;一直是利用;之前探索,现在转为利用;之前利用,现在转为探索。图5展示了真实数据中的统计趋势,说明四种策略中,只有创作风格由探索转为利用,和巅峰期出现的概率提高相关。
图5. 艺术(s)、文化(t)及科学(u)领域,相比于随机模拟数据的基准概率,4种不同的创作风格改变策略对应的巅峰期到来的概率变化。当巅峰时刻过去后,曾经的灵感不再,天才变得泯然众人。反映在数据中便是,作品的信息熵变得和随机模拟数据没有显著差异,见图6。一个不好的消息是,平均来说,巅峰时刻仅仅持续5年。
图6. 巅峰期结束后,艺术、文化及科学领域(a-c)作品的平均信息熵和模拟数据分布的情况,(d-f)对应的时序变化,红色对应巅峰时间,绿色对应巅峰时刻过后,灰色对应模拟数据。###
4. 与之前研究结论契合:
小团队更多做出原创性发现
研究还分析了巅峰期到来前和处于巅峰期时,科研团队大小的变化,说明随着研究风格由原创性的探索转为对已有领域的利用,团队规模确实会变大,如图7。小团队受限于知识组成,很难对某一领域进行细致研究,在利用阶段,大团队有其优势所在。
图7.(a)科研团队大小在巅峰期到来前后的变化情况,其中灰色是模拟数据。(b)随着科研团队变大(横轴),巅峰期到来前后(依次是蓝色和红色)真实和模拟场景下相对数量比值的变化。可见巅峰期到来前,小于三人的团队占比高,而处于巅峰期时,处在大团队中的比例更高。这与之前研究的结论相契合。此前吴令飞、王大顺和Evans等人合作研究发现,科研团队规模与创新有关:小团队偏向颠覆式创新,大团队偏向渐进应用式创新。这一结论,对如今这个科研越发保守的时代有重要启发:如果想促成原创性的成果,是不是应该更多鼓励小团队进行科研呢?
5. 深度学习助力创造性研究
这项研究启发我们,可以通过对创造者的作品进行高维表征,判断其风格特征演化,并提供相应职业生涯建议。对于那些职业初期就像刺猬的研究者,需要提供的建议或许是,长时间反复钻研同一类作品可能扼杀创造力,在生涯初期不妨偏离大家惯常所走的路线,而不是待在安全地带。当观察到某个创作者的风格从探索转为利用时,需要对其投入更多资源,帮助他在巅峰期产出高价值的作品,这使投资收益比更高。
需要指出的是,创造性活动本质是复杂的,不存在简单规律作为成功法则。许多潜在因素都可能影响职业生涯中巅峰期的出现。此外,研究也只表明先探索再利用与巅峰期出现的相关性,要探讨这背后的因果关系,则需要进一步深入研究。
总结来说,研究使用的表征方法为创造性研究开辟了广阔的前景,也为探讨创造性作品的特征提供了一个定量框架。在未来,深度学习的进展将帮助研究人员考虑更多与创造性相关的维度,从计算的角度增强对创造性的理解。
从研究方法上,这项研究演示了如何使用深度学习及复杂网络对创造性活动进行自动化建模,扩展了关于成功的科学可选的工具箱。虽然该研究没有考虑在不同时期,主流文化/经济变化/技术进步等背景因素或限制对艺术、文化及科研产出带来的影响,也没有解释为何先探索再利用的风格转变和巅峰期的出现相关,但其结论或许也不难理解。
自然界中小狮子学习捕猎,不也是先尝试各种类型的猎物,再专门练习捕捉某一类猎物吗?成功的企业先试错多种产品,再聚焦主业提升性价比,而在强化学习范式下,也是先探索环境,再去利用找到的策略获利的。创意活动遵循类似的规律,不应是自然而然吗?
在讨论该研究的意义前,先回顾学术界的几个趋势,一个是论文发表的压力越来越大,为此不得不上马一批短平快能快速取得成果的项目;另一趋势则是对前沿探索的支持也在加大,像美国国防高级研究计划局(DAPPA)就以支持那些最初看起来不太可能,但一旦成功就影响巨大的项目而闻名。如何应对这两种相互矛盾的趋势?不应该采取和稀泥式的中庸,复杂科学告诉我们,既然创造活动不存在简单规律,那就要用魔法战胜魔法。
而该研究结论,对流行文化的意义,在于其驱散了两个错误的“神话”,一是匠人精神,就是从小钻研某一技术几十年,终于成为无可取代的大神,在这个变化日新月异的时代,更应该的是普及通识教育,让更多人先探索;第二则是“斜杠青年”,仿佛成功者都要身兼多职,且不知个人在进入利用阶段后,就不应该再做斜杠青年,而要有所专精。
更多阅读
文2021-09-28 18:12:13
模式化永远会扼杀创新,这个研究也不例外赞 3