好书推荐-《结果与原因的经济学》极简因果推断教程

/pic/1_a9S9L5iarCtbH72cSnHLwJXOKwBedQ.jpg
因果推断的书一向都难,这本书相对《为什么》更加简明易懂,作者通过生活中必不可少的教育和医疗相关的例子,说明搞清楚因果关系的重要性,之后指出了因果推断的几种方法,助你获得解读数据分析结果的能力。本书不涉及经济学的基础知识,更不会用到任何公式。
成功人士的故事里只包括事实,而不包括反事实。如果忽略了这一点,仅凭事实就片面地认为存在因果关系,一味禁止孩子看电视或者频繁接受体检,很可能不但无法成功,反而白白浪费了时间和金钱。
经济学讲究成本收益,采取任何行动都需要花费可观的金钱和时间。偏信看似存在因果关系的“无稽之谈”,将其作为行动依据,不仅得不到预期的成效,还白白浪费了金钱和时间。唯有依据因果关系有效地把这些金钱和时间利用起来,获得满意的成果的概率才能提高。

1)进行因果推断的三个步骤
要证明因果关系的存在,必须对“事实”中原因发生后的结果与“反事实”中原因未曾发生时的结果进行对比。可现实中我们可以观测事实,但无法观测到反事实。现实中如果每个人都有一个双胞胎,和你在各方面都很像,除了某个关键的决策,那就可以用你和Ta的对比,当成反事实进行比较,从而推出因果关系。然而,现实中我们很难找到这样的事例。正因为如此,因果推断要运用各种方法,尝试将两个不相似的组转化为“可比较”的组。

/pic/2_6NBFZEadtvP5Dia1iaqlvWL4wWDI0Q.png

因果推断,由于其类型不同,证据的强度也会有所不同,可信度高的证据是由能正确判断因果关系的方法推导出来的,可信度低的证据是通过可能混淆因果关系和相关关系的方法推导出来的。在上面的“证据金字塔“中,越接近金字塔的顶点,证据的可信度越高。图中元分析指整合的是多个观测研究,其证据等级高低取决于其使用的研究的证据等级。
不管哪种方式,因果推断都要进行下面的三步:

1,搞清楚原因,结果分别是什么?2,质疑是不是巧合,是否存在混杂因素或逆向因果关系?3,通过调整形成“可比较”的组,用最贴切的值替换反事实的结果
2)随机实验与自然实验

随机实验虽然有成本高,由于伦理原因使用范围受限等缺点,且很多随机对照试验在挑选研究对象时都设有严格的筛选条件,因此无法确定该研究结果是否也适用于其他群体。从而导致与随机对照试验中得到的效果(efficacy)相比,实际在整个社会实践后产生的实效(effectiveness)可能会变小。但随即实验对于上面第二点的三个问题,都能给出确定无疑的回答,因此是因果推断界的金标准,
用现有数据重现与实验类似的环境,例如通过法律或制度变化、自然灾害、战乱等人们无法预测的变化,找到与随机对照试验类似的环境,同样可以“制造可比较的组,用最贴切的值替换反事实”,从而明确两个变量之间的因果关系。例如在男女医生是轮班制的医院,对比男女医生负责患者的死亡率,发现女医生负责的病患平均死亡率低0.4%,但这样的实验,前提是患者不能选择医生,否则上述差异就可能是由于重症患者愿意选择男医生造成的。
3)用“差异”的差异来推算干预的效果
假设要判断投广告的效果,可平行对比俩个地区A和B在A投放,B不投放的情况下,销售额的差异,如下图所示,两地区的销售额涨幅的差200万日元,即为双重差分法得出的干预的因果效应。
/pic/3_Nmg90zGU8EU3QoVS7lia03P235BhuQ.png双重差分法的假设是A和B之间是可比较的,例如都是销售同样的东西,俩地的人群组成,购买力相同。且在干预期间,没有出现影响销售额的“其他变化”。
如果能找到“对结果没有直接影响,但会通过影响原因间接影响结果”的第三变量,可以通过这样的变量来判断因果关系。也可以比较差异的差异来判断因果关系,例如广告费打折和投放广告有关,和销售额无关,那么可以比较是否即使打折活动促使投放广告的店铺增多,销售额也不一定会上涨,如下图所示:
/pic/4_yKx5fOxibJb7gs8SBqWGDIXPJCNcWQ.png

4)关注跳跃的断点回归
员工越多,一个店的销售额越多。如果员工人数49人的店铺不投放广告,而50人的店铺投放广告,然后关注是否在销售额上出现跳跃,就可以判定俩者之间是否存在因果关系。
/pic/5_PbCVvCrf8JTEnDRlGjJrnaOkVz716w.png
用断点回归设计推算因果效应,必须满足一个重要的前提条件:在连续变量的断点附近,没有发生过影响结果的其他事件。比如,假设员工人数50人以上(含50人)的店铺不仅可以投放广告,还会根据销售额发放奖金。在这种情况下,就无法判断断点的“跳跃”是广告的效果还是奖金的效果了。
无论是断点分析,工具变量,还是双重差分,都无法从逻辑上排除混杂因素的干扰,也无法证明反向的因果关系不存在。这三者相比较,断点分析假设不存在临界点,即连续的变量,不论有没有干预,都对应连续的结果。可实际上,假设上述的实验中没有断点,可能是因为超过50人的店铺,人员的管理难度超过了店长的能力,导致如果没有广告,这些店铺的收益本应该相对更差的。

5)匹配和回归,相似的放在一起比较

证据金字塔中,等级最低的是匹配法及多元回归,通过找到能够影响结果的协变量,从对照组中选出和干预组相似的样本进行匹配,并对两个组进行比较。存在多个协变量时,也可以将它们整合成一个得分进行匹配。例如互联网中的A/B测试。
然而,不是所有会影响结果的协变量均为可转化成数值的数据,例如文化习俗,消费习惯等,找到所有的协变量,也不是容易的事,而要进行这类的分析,需要将所有协变量都用来计算倾向得分。
在找不到相似的组,来进行比较的时候,只能基于手上的数据,用多元回归的方式,对各个可能因素的影响进行校正,之后画出表示原因与结果的关系的“回归线”,并根据回归线的倾斜程度来评估因果效应。这是当前大数据常见的分析方式,其得出的因果关系判断,可信度最低。这不是能通过提升数据量,或者采用更干净的,没有噪音数据就能克服的。是方法本身自有的局限。
6)数据解读能力,现代人的必需技能
在“大数据”成为流行词的当下,数据分析随处可见。然而,数据本身只不过是罗列在一起的数字。“如何解读”数据分析才是关键。正如在信息爆炸的年代,筛选信息的能力变得至关重要。疫情中,人们对因果关系越发饥渴,但越是这时候,越要冷静下来,判断究竟是不是伪因果。从这个意义上讲,“因果推理”如今已经不再只是科研人员的“专利”,而是所有不要被个别现象误导的聪明人所必备的素养。
在教育和医疗领域,无稽之谈和传统观念的影响力依旧很强,想在证据的基础上制定政策绝非易事。证明“因果关系”的存在,评定因果关系的可靠性,只有通过体系化的“因果推理”才能形成证据。希望本文举出的这些工具能够对生活在数据泛滥时代的各位读者有所帮助,这会让笔者由衷的感到欣慰。

更多阅读

樱花,气候,相关性与因果性
将因果思维融入机器学习,实现信息处理的自动化
自由意志和因果推理-《为什么》书摘
年度必读书-《为什么:关于因果关系的新科学》

东方昊2020-03-15 17:29:56

感谢分享,mlook似乎有对应资源