模型思维应用案例之成功的循环定义与夏普利值

今天的文,还是要感谢《模型思维》这本书,但引子却来源于湛庐文化的另一本书《巴拉巴西的成功法则》看完这本书,觉得安替对这本书的评价很到位,他在朋友圈写道:“这本书最大的洞见是人对高段位的卓越的感知颗粒度太粗,导致必须被迫瞎打分。其他结论是这个发现的逻辑延伸。”这话对于见识了名校博士水平差异之大不断刷新认知的笔者,只能说心有戚戚焉。“才能是有限的,成功却是无限的”,这条在巴拉巴西书中提出的第二条的成功法则,也有其暗黑的一面。

/pic/1_IlTxYxXB5KKibkC81Dnnhicuuv83ng.png

这让我想到了今年10月看到的一篇Nature communication文章,题为:“Early coauthorship with top scientists predicts success in academic careers”,文章分析了不同学科的科学家的论文发表记录,得出对于同段位的科学家,在职业生涯早期,和顶级科学家合作撰写论文的经历,能够预测该科学家在未来20年间,将会取得相对更好的表现。文中写道,对于这一预测,有俩种解释,一是是顶级的科学家选择年轻科学家中最优秀的,因此她们在未来更成功;二是由于和顶级科学家合作的经历,使得这些科学家在未来能获得更多的引用,更广的人脉,从而将其成功归因于圈子而不是能力。文中虽然指出无法严格确证上述的哪一种解释是合理的,但当前的证据更多指向后者。

这很让人担忧,科学技术是第一生产力,可如今评价科研人员的引用数,却有循环定义之嫌,知名的科学家因为其在该领域的知名度,获得越来越多的引用,新一代的科学家,谁能抱上大佬的大腿,谁就更有机会成功,如此投机分子找到了捷径,学界的风气也会更加浮躁。而根据17年Science advance上的一篇论文:“Science and Technology Advance through Surprise ”,使用同样的数据,文中发现跨学科的研究,更容易获得引用。该研究的一种解读是当在本学科遇到无法解决问题时,应该在其他学科寻找解决问题的套路,而另一种解读则是如果在本学科研究遇到难关,那就应该去选择那些跨学科合作的机会。如果后一种解释占了主流,那谁还愿意去攻克本学科的难题?宣扬跨学科协作能促进创新,就变成又一例有好的出发点却办了坏事的案例。

上述论断的核心问题是,在人烟稀少的地段,对于高段位的成功,该如何避免外行评价内行。由于任何人的成功,都是依赖于一个团队的,因此《模型思维》这本书中第九章“与价值和权力有关的模型”,可以派上用场。该章的开篇引言也很棒:“你的价值不在于你知道了什么,而在于你能够分享什么”。为了分配团队中成员的贡献度,引入了博弈论中的夏普利值(Shapley value),其定义为,假设N个博弈者加入合作的的所有可能顺序,看每种次序下参与者i加入时,团队价值函数发生的变化,参与者i的夏普利值为所有可能次序中,价值变化的平均值。

/pic/2_pZ06lnpcwxmNKtDyUOE53cRFZWS90w.png

上图展示了在团队创造力中(列出区块链的不同用途),不同参与者的夏普利值和其贡献的答案数目不同。夏普利值之所以能够评价个人的贡献,在于其满足以下四条人们对于公平的朴素假设:

1)在任何情况下,都没有给团队带来额外价值,那Ta的贡献就是零

2)如果俩个人增加的价值相等,那么其也要分配到相同的贡献度

3)团队的价值要百分百的在团队间分配,不存在无法说清楚的贡献

4)如果一组人参加了多次合作,那么团队中每个人的贡献度等于其在每次合作中贡献度的和

在现实中,通过计算夏普利值,来评价一个人的价值,是看如果一个团队中,如果将某人替换,那么成功是否还会如期到来。例如考虑到顶尖科学家对新一代科学家带来的“流量光环”,假设将因流量光环成功的科学家,换成处于职业生涯早期的其他科学家,是否也会取得一样的成功。如果换人后,大概率也能成功(根据成功路上是否涉及个人的艰难决策和常人所不及的天才),那么该人的成功更多是由于网络带来的马太效应,并不能反映出该人具有超人的天赋或能力。对于跨学科的例子,采取夏普利值,可以区别跨学科的合作中,随的贡献更大,如果是跨学科的方法学启示,那就需要首先去深究问题本身,否则乱用其他领域的方法,无法带来价值增量,由此可以将那些为了解决问题让选择跨学科合作的研究者,和那些为了跨学科而跨学科的研究者区分开。

对于机器学习来说,夏普利值还能给回归模型赋予可解释性,针对各个输入模型的特征,计算每个特征的夏普利值,根据特征对应夏普利值的相对大小,解释模型中的那个特征,对促使模型做出了相应的预测贡献更大。具体内容参考Christoph Molnar的书籍Interpretable Machine Learning中的对应章节:

https://christophm.github.io/interpretable-ml-book/shapley.html

更多阅读

模型思维的应用-空间竞争模型与维度打击

模型思维-改变社会科学研究的新范式

什么才算是好的对成功的解释-评《巴拉巴西的成功定律》