目录

浅薄的人相信运气,强大的人相信因果-鉴书《大侦探经济学》

近30年来,伴随着数据可得性的改善和计量经济学的发展,现代经济学爆发了一场因果推断革命。这场革命使许多经济学家的工作越来越像柯南·道尔笔下的大侦探福尔摩斯推理断案,为我们破解经济与社会生活中的众多奇案和悬案。本书就是这些大侦探破案故事的精彩呈现,涵盖范围不仅包含诸如劳动经济学、犯罪经济学等微观经济学领域,也包括经济发展、繁荣与萧条以及社会流动等宏观经济学主题,洞见卓越,思想深刻。

同时,本书还系统地介绍了经济学大侦探使用的最重要的五种因果推断方法,不仅以故事形式深入浅出地讲解了这些方法的历史和逻辑,还具体入微地把它们在经济学研究中的表现以侦探故事的形式呈现出来。本书既是一部雅俗共赏的经济学硬核科普著作,也是一本关于因果推断研究的精彩入门读物。

/pic/1_FaKtoz9jLM0WdsEtOicQdoqaDODGVg.jpg

作者简介:

李井奎,浙江大学人文高等研究院驻访学者,哈佛大学法律经济学项目访问学者、博士后研究员,浙江工商大学经济学教授、博士生导师,在法律经济学和经济思想史领域发表学术论文多篇,出版专著多部。另著有随笔集《亲历:一位经济学家在哈佛看美国》,译有《约翰·梅纳德·凯恩斯文集》(共十一卷)。

主要看点:

① 浅薄的人相信运气,强大的人相信因果。

② 分辨因果,看清真相,做对决策。

③ 建立科学思维方式,种对了“因”,才能结出想要的“果”。

④ 因果推断是每个人的必备素养,在信息爆发的大数据时代尤为如此。

⑤ 万事万物本身不过是一条原因和结果的无穷锁链,互关互联。

⑥ 紧跟学术前沿,聚焦热门话题,深度有趣的探索,出乎意料的真相。

书摘:

精英高中的幻觉——学区房是否值得买

据说,一个北京的中产,其毕生的梦想,就是在海淀区买一套房子,让自己的孩子上人大附中。

把孩子送进重点中学,是无数中国家长的梦!

在北京海淀黄庄,有一座慧聪书院,它坐落在上风上水的中关村广场。这座慧聪书院,古称文圣庙,在明清时期,这里是进京赶考的举子们必拜的圣地。

今天的海淀黄庄,一个个培训机构萦绕着这座文物建筑,延续着已经有了数百年的求学氛围。海淀黄庄位于北京中关村东南角,不远处就是一批中国顶尖的学府——北京大学、清华大学、中国人民大学等,这里也被称为“宇宙补习中心”。

来海淀黄庄补习的孩子们从来都是步履匆匆,他们享受着全国最优秀的教育资源,仍然孜孜汲汲,唯恐落后。家长们也是拿出金钱、时间和精力,跟着一起坐在补习班里做笔记,比孩子们还要努力。

海淀黄庄这样的景象,在全国不是孤例。笔者所居住的杭州市,同样如此。在家长们看来,把孩子送进重点高中,那就已经成了精英的一部分,离上重点大学只有一步之遥了,而孩子周围的同学也都是一时之选,想一想就令人激动。如此的前景,自然让无数父母趋之若鹜,唯恐让孩子输在起跑线上。

这种现象东西方皆然,美国也不例外。在波士顿和纽约的公立学校系统中,同样有一些类似于中国重点中学的精英学校。与大多数其他美国公立学校不同,精英学校的申请者要根据竞争性的考试成绩来进行选拔。波士顿精英中学中的旗舰,是波士顿拉丁学校(Boston Latin School),这是美国最古老的中学,创建于1635年,比哈佛大学的建校时间还要早一年。纽约的布朗克斯高中(Bronx High School of Science)和史岱文森高中(Stuyvesant High School)同样是闻名遐迩的著名中学。为进入这些中学就读,美国的孩子一样要经历激烈的竞争,才能有机会获得有限的入学名额。

经过残酷的选拔才能进入波士顿和纽约精英高中的学生,在美国的大学入学资格考试成绩方面表现向来不俗,远远高于普通的公立高中,这种结果自然也是各个精英高中拿出来自我吹嘘的资本。家长们对这些精英中学趋之若鹜,也很好理解。无论是哪一项指标,这些精英中学都能甩普通公立高中好几条街去。不可否认,精英中学在教育上确实可能具有某些优势。

第一,精英中学的学生都很优秀,这可能会带来所谓的“同群效应”(peer effects)。所谓同群效应,其实就是“近朱者赤,近墨者黑”。当年孟子的母亲为了给儿子创造一个好的环境,三次搬家,留下了“孟母三迁”的故事,也是因为孟母相信同群效应。同是精英学校的学生,大家比着学习,很可能会共同提高成绩。

第二,这些精英中学在课程体系上与众不同,开设了各种高级课程,以提高学生的学习能力,扩大他们的知识范围。比如,史岱文森中学就吹嘘称他们有全美最多的高级课程学习者。除了这些高级课程,这些中学还经常提供一些学术研究机会。精英中学的学生在全美数学大赛以及其他类似的奖项上也是斩获颇丰。

第三,但也可能是最重要的,就是这些精英中学非常有钱,经常可以得到捐赠,并为某些特殊的项目接受金钱资助。这些资源可以用于大学奖学金、教职员工的培训支出,也可以用来购买各种器材,增建各种设施。比如,纽约的布鲁克林高中基金会在2005年一次就为学校筹款1 000万美元,这些资金分别用于学校的机器人实验室、图书馆、健身房等设施的改进。

有意思的是,虽然精英中学的课程更为丰富,设施更为先进,但相比于传统的公立学校,它们的班级规模却更大。例如,波士顿拉丁学校的生师比是 22,也就是说,1 个老师对应着 22 个学生。而在波士顿的普通公立学校,这个比例在初中是12,在高中是15,都远低于波士顿拉丁学校。在纽约,精英高中的生师比甚至达到31,而纽约的普通公立高中则为27。

此外,精英学校的录取名额中原来是需要留一定的比例给少数族裔的。根据波士顿法院在20世纪70年代的裁决,波士顿拉丁学校的注册学生中黑人和西班牙裔不得低于35%。但这一判决在1996年受到了挑战,从1999年开始,波士顿精英中学招生完全根据测试成绩和GPA(前一个学段的平均分数)而定。

2014年,大侦探安格里斯特与他的合作者阿蒂拉·阿卜杜勒卡迪罗卢(Atila Abdulkadiroğlu)、帕拉格·帕莎克(Parag Pathak)在经济学顶级期刊《计量经济学杂志》发表了一篇文章,使用波士顿和纽约各自城市的前三名精英高中的数据,为我们估计了精英高中的学生相比于普通高中在美国的大学入学资格考试成绩(SAT等)上的差别。安格里斯特等人写的这篇文章目的就是估计精英中学的学生与普通中学相比,在大学入学资格考试成绩上是否存在显著的差异。

精英中学的学生现在在大学入学资格考试成绩上的优异表现,是不是都可以归结为这些学校与众不同的教育方式呢?恐怕不能。与我们这一章前面几个有关教育回报的估计一样,这里存在着所谓“选择性偏误”。什么是选择性偏误呢?那就是这些能够进入精英中学学习的孩子们,本来就天资聪颖,如果把他们放在普通的公立中学,他们未必就比现在的表现差。这个学生自身的能力,是导致出现选择性偏误的遗漏变量。

我们的大侦探安格里斯特及其合作者又是如何解决这个问题的呢?

我们在“墨西哥毒品战争之殇”一章中,为了介绍断点回归方法,曾经举了一个中国高考的例子,在那个例子里,只有考上重点线的学生才能进入重点大学读书,而如果没有考到重点线,哪怕只差一分,也只能是名落孙山,不得不上一所普通的本科院校。由此,我们可以估计上重点大学比上一般本科院校对学生未来收入的影响是怎么样的。我们国家的高考制度非常严格,所以,高考成绩重点线的划分也就自然把学生划成了两组,我们把刚刚高出重点线几分的学生划为干预组或处理组,把恰恰低于重点线几分的学生划为对照组或控制组,就可以比较上重点大学对未来收入的影响了。这个断点,我们把它称为清晰断点,因为它是非此即彼的,非常严格。

大侦探安格里斯特及其合作者使用的也是断点回归,不过,这个断点不是清晰断点,而是模糊断点。在“看不见的雾霾杀手”一章中,我们已经介绍过了什么叫作模糊断点。我们这里以大侦探安格里斯特等人的研究为例,再来具体做出说明。

在波士顿和纽约的精英高中录取过程中,这些学校需要进行一场入学考试。根据考试成绩,每个学校确定一个录取分数线。这个时候,我们如果把刚刚高出录取分数线几分以内的考生挑出来,然后再把仅仅比录取分数线低几分的考生挑出来,把他们分成两组,那么,这个录取分数线就是一个断点。可又为什么说这个断点不是清晰断点呢?这是因为考过这个分数线的考生最后不一定会进入精英中学学习,这样一来,那些仅仅比录取分数线低几分的考生也有进入精英中学就读的机会。所以,考过录取分数线的考生不一定会入学,而那些低上几分的考生也不是完全没有机会,只是机会比前面那些考生少而已。这个断点,就是模糊断点。模糊断点回归方法与工具变量回归的方法类似,有关这一点,我们在“看不见的雾霾杀手”一章已经述及,此处不再赘述。

在模糊断点回归方法研究下,几位大侦探最终得到的结论是:进入这些精英中学学习,相比于在普通公立高中学习,并没有使学生取得更为优秀的大学入学资格考试成绩。也就是说,虽然这些精英高中的学生身边都是同代人中的佼佼者,虽然他们的课程更具挑战性,但是那些仅以数分之差而进入精英高中学习的学生,相比于仅以几分之差名落孙山而进入普通公立学校学习的学生,在大学入学资格考试成绩上,他们丝毫没有表现出更加出色。

不知道那些为了让孩子能够进入重点中学就读挖空心思的家长们,在听到大侦探这样的研究结论之后会做何感想?

通天河畔的领悟——断点设计揭谜底

话说唐僧师徒经历千难万险,终于从西天如来处取得真经,几个人人扛马驮,一路把佛经送往东土大唐。这一天,师徒四人走到了通天河,只见通天河波涛汹涌,浊浪排空,正发愁怎么过去。悟空远远看到了一只大老鼋,原来它早就等在这里接唐僧师徒过河。

师徒几个人欢天喜地上了大老鼋的背上,乘风破浪,来到通天河上。大老鼋原是这通天河的主人,后来被妖怪灵感大王夺了巢穴,幸得孙悟空去南海请了观世音菩萨,用鱼篮收走了灵感大王。西去时,大老鼋驮唐僧师徒渡过通天河就是为了报答孙悟空,当时他还让唐僧代问佛祖自己什么时候才能脱掉本壳,修成人身。现在,一行人在通天河上兴高采烈,大老鼋又向唐僧问起此事。唐僧一听,心里暗叫:“哎呀不好,我到了灵山,竟然把这个事给忘记了。”但唐僧是个实在人,不会说谎,只得老实向大老鼋承认,他把这事给忘了。这可把大老鼋给气坏了,他心想:“我日日夜夜盼你们回来给我带个信,没想到你们竟然给忘了,真是太不把我当回事了。”于是,一生气,大老鼋沉到水底去了,唐僧师徒连同经卷一下子都掉到了通天河中。最后还是观音菩萨把他们从水里救了上来,并且告诉他们说:“你们师徒总共才经历了八十难,还差一难,才能达到九九归真之数,这一难你们是没有办法躲掉的。”

等到唐僧师徒终于一个个都爬到岸上,这才把经卷打捞上来,摆在阳光下,等着经卷一一晒干。

八戒看到这个场景,不禁嘟囔道:“如来佛祖这是干什么呀?还说什么九九八十一难,非得让我们受这份罪。”

唐僧说道:“八戒,休得胡言乱语。求取真经本来就是千难万苦的事情,这最后一点磨难算得了什么?”

沙僧看到大师兄孙悟空一直在一旁静静思索,于是问道:“大师兄,你在想什么呢?”

悟空此时缓缓转过身来,一脸严肃,开言道:“我总觉得,咱们这场西天取经,似乎是如来佛祖和玉皇大帝合伙安排的一场阴谋。”

“什么?阴谋?”猪八戒一听,骨碌一下从地上爬起来,说道:“我说猴哥,你不是早就批评过,不要啥事都往阴谋论上扯吗?这回你怎么自己也开始宣扬阴谋论的论调了?”

只见行者掣起金箍棒在地上画了一幅从东土到西天的地图来,并在这地图上标记何处遇到了何种妖怪,师徒几人遇到了哪些磨难,并把各种妖怪盘踞该处的时间也都标上。

沙僧这个时候也感到大惑不解,忙问:“大师兄,你这是在做什么?”

唐僧此时也说道:“悟空,你又在搞什么玄虚?阴谋论这样的说法,可要慎重,没有真凭实据,不可以乱说。”

行者笑道:“师父,我若没有凭据,断不敢胡乱说。”

八戒撇了撇嘴说道:“师兄这张嘴,谁不敢说?你难道还有玉帝和如来一起商量让咱们瞎跑这一趟的录音不成?”

那悟空跳到高处,说道:“呆子,莫要胡说,要相信科学。我先说咱们这一路,难道你们不觉得生疑?我怀疑,早在五百年前,我大闹天宫的时候,如来应玉帝之邀来捉拿我,就已经商量好了让师父西天取经的事情。那如来一直希望能够把佛教势力扩大到东土,过去有玉帝的道教抵抗,无法进来。没想到,我在东胜神洲闹得动静太大,玉帝不得不请如来一起联手剿灭我花果山。如来把我压在五行山下,已经有了主意。他以此为筹码与玉帝做生意,希望把佛教传入东土。可要传入东土,就必须得有一个能让大家都看到的伟大故事,于是才有了我们师徒跋山涉水,从东土大唐一路走到灵山,去取这真经。我们这一路就仿佛是搞了一场路演,或者说是搞了一场历时多年、多地的大型行为艺术,搞得是天下皆知,而且我们这样千辛万苦才求取到的真经,自然也更为一般的普通愚民所相信。”

唐僧听后,默然不语。

沙僧这时候问道:“大师兄说的虽然在理,但仍然是猜测而已,既然是猜测,就有其他的可能,这阴谋论恐怕难以坐实啊。”没想到,猪八戒这个时候却突然一拍大腿,说道:“猴哥说的很有可能。把我投胎到高老庄,把沙师弟流放到流沙河,这都是师父西天取经的必经之处。另外,把猴哥压在五行山下,也是奇怪,这地点奇怪。五行山所在地正好在东土大唐的边界上,是通往西天的必经之地,这一切都很巧合啊!”

这时候,唐僧双掌合十,说道:“八戒,你刚才所说,也许只是巧合而已,不见得就是如来佛祖和玉帝的有意安排。”

悟空接下话头说道:“师父说的原也不错,我当初也这样想,直到最近,我到了西方,学到了一种叫作断点回归的方法,才把这个谜底给猜出来。”

沙僧忙问道:“大师兄,你是如何猜到谜底的,快说来给我们听听吧。”

悟空用金箍棒一指他刚才画出来的地图,说道:“师父和两位师弟请看,在这幅地图中,我把每个妖怪下凡到盘踞地界的时间都标在了上面。你们还记得师父是哪一年从东土大唐出发去西天取经的吗?对,是大唐贞观三年,这一年刚好是我压在五行山下五百年,也是八戒和沙师弟被贬下凡的那一年。”

八戒和沙僧都点头称是。

悟空继续说道:“这大唐贞观三年就是一个时间上的断点。你们看,在贞观三年以前,西天路上的妖怪基本上都是本土生长的,而且由于去往西天路上经过的大多是贫瘠之地,所以,妖怪不是很多,在更南边的四川盆地和更北边的天山脚下,盘踞着更多妖怪。过去若真有神仙被贬下凡,也往往是随机地投胎到各地,西天路上的地界占全部天地之间的范围很小,贬到这里的可能性是很低的。但这一年之后,却突然之间有大量妖怪到了去往西天的路上盘踞,而且其中大部分都是和天界有关系的妖怪,岂不怪哉?”

唐僧禁不住点了点头,但随即又摇了摇头,说道:“悟空,也许是大唐贞观三年这一年,天界碰巧发生了其他的变故,正好有一批神仙同时出了点事情,巧合发生了。这也未必就是你说的那种阴谋吧?”

八戒和沙僧一脸疑惑,也把怀疑的目光再次投向了悟空。

悟空道:“师父说的极是,这种可能原本也许是会有的。但我仔细检查了一番之后,发现情况并非如此。”

唐僧示意悟空说下去。

悟空用金箍棒再指了一下地图,说道:“师父及两位师弟来看,如果这一年天界发生了变故,许多神仙被贬下凡,我们了解贬入凡间的机制,一般来说都是被随机地贬入凡间,所以,即便这一年天界真的发生了什么变故,也不应该都把神仙贬到去往西天的路上。”悟空一指更为广阔的南方和北方,继续说道:“你们看,大唐贞观三年之后,这些地方,竟然没有一个神仙被贬下凡间。如此反常,不能不令人生疑。”

悟空继续说道:“除此之外,我还对神仙们下凡的原因一一做了调查,我发现,这些原因五花八门,但多数都很可疑。比如沙师弟,他在王母娘娘蟠桃会上失手打破了一个琉璃盏,这本来是一件很平常的小事,玉帝却异常震怒,把他贬到流沙河做妖怪。这在过去是从来没有出现过的事。”一席话说的沙僧频频点头:“我也一直百思不得其解,今天听师兄这么一说,觉得很有道理。”

悟空看了看八戒,八戒低下了头。悟空笑道:“八戒本来是天蓬元帅,调戏嫦娥仙子,这才被贬下凡,做了一头猪。罪责和刑罚倒是得当,但哪里不好投胎,反而投胎到高老庄。按我说,该罚他去极北苦寒之地,那不就没有这番与高小姐的婚事了?再看那老君的青牛精、烧火的童子,如来脚下偷油的老鼠,他们偷偷下凡的事情,过去从来没有过,怎么一到大唐贞观三年,这一切都出来了。所以说,我们如果拿大唐贞观三年做一个断点,把这一年之前的十年间的妖怪的身份和地区分布,与这一年之后十年间的妖怪身份和地区分布进行比较,就可以明显看到,这是玉帝和如来两个家伙有意为之。目的就是让我们大张旗鼓地跑这一趟给全天下的愚夫愚妇们看,这佛经得来不易,佛教能带他们脱离苦海。

悟空这一番话,说的众人都沉默不语。

最后,唐僧道:“悟空,你学的这种断点回归之术,的确颇为神奇。无论是你之前用到过的随机实验方法、匹配回归方法,还是这神奇的断点设计方法,都是西方科学精神的体现。我千辛万苦研读佛法,把这些佛经带回东土,目的是要渡天下百姓,让他们能够脱离苦海,发现真理。你将来不妨也像我一样,到西方把这种科学精神带回东土大唐,让这个飞天民族能够大力发展科学,壮大力量,走向富裕。这才是你们应该做的事情。”

说话间,夕阳西下。

悟空眼望东方,只见寒鸦纷飞,落木萧萧,长安城影影绰绰。悟空知道,师父又何尝不知玉帝与如来的这番用心!他就是要为东土大唐带回佛教思想,在他心中,让祖国汲取各种思想和技术,荟萃天下,博采众长,胸怀世界,这才能真正实现让这个飞天民族屹立于世界的梦想。想到这里,悟空望着师父坚毅的背影,不禁热泪盈眶。

如今,断点回归方法越来越多地应用于社会科学的研究当中。在本书的许多大侦探故事中,很多篇都有断点回归的影子,其中最擅长使用断点回归设计的是哈佛大学经济系的梅丽莎·戴尔教授(参见本书第二章)。

断点回归设计最早是由两位心理学家唐纳德·斯特里斯维特(Donald L. Thistlethwaite)和唐纳德·坎贝尔(Donald T. Campbell)在20世纪60年代提出来的。当时,他们想研究美国国家学业奖学金对获奖者的职业和人生态度产生的影响。美国国家学业奖学金需要经过多轮评选,最终一年只有不到1 000名优秀的高中高年级学生获得这项奖学金。这项奖学金基于申请人在PSAT和SAT考试的成绩进行评选,这两个考试是绝大多数美国大学申请人都会参加的大学入学考试。相较于其他人,两位心理学家先使用匹配回归方法,得到那些获得美国国家学业奖学金的优胜者最终成为一名高校教师或研究员的概率要高4%,但针对国家学业奖学金优胜者的分数线进行的断点回归设计所给出的结果却只有2%,并且在统计上并不显著。这说明,使用匹配回归方法得到的结果要想解释成因果效应,有一个前提条件,那就是基本上所有的相关变量都是可观测的,且都纳入了回归方程中,不存在其他不可观察的遗漏变量。但有时候,这个假设可能太严格了,遗漏变量带来的偏误在所难免,使用断点回归设计就可以更好地把研究对象进行随机化分组,因为断点的选择本身与实验对象的其他特征不相关,这就不会影响她或他进入到干预组或控制组的概率。因此,断点回归设计所得到的结果就会更加可信。

唐纳德·坎贝尔是20世纪美国著名的社会心理学家,也是社会科学方法论的重要思想家之一,1970年获美国心理学会颁发的杰出科学贡献奖,曾经担任美国心理学会主席。他在1963年与朱利安·斯坦利(Julian C. Stanley)合作撰写的专著《实验与准实验研究设计》,至今仍然是重要的参考文献,对实验方法和计量方法做出了先驱性的研究贡献。

教育回报——多读一年书到底能带来多少收入?

中国古代历来有重视读书的传统。

北宋著名学者汪洙曾写过一篇影响广泛的启蒙读物《神童诗》,其中有这样的句子:“天子重英豪,文章教尔曹;万般皆下品,唯有读书高。少小须勤学,文章可立身;满朝朱紫贵,尽是读书人。”北宋真宗皇帝赵恒在著名的《励学篇》中更是写下“书中自有颜如玉”“书中自有黄金屋”的诗句,鼓励士人读书。这两首诗在后世广为流传,所讲的内容几乎渗入了每个中国人的骨髓之中。

在中国古代,一个人要想出人头地,实现人生理想,读书做官是为数不多的几条途径之一。正所谓“男儿欲遂平生志,五经勤向窗前读”“朝为田舍郎,暮登天子堂”,读书的收益当然是巨大的。但是,随着现代社会教育逐渐普及,甚至高等教育也不再那么稀缺,人们读书考入大学的机会较之以前大大提高。同时,在改革开放初期,由于分配制度改革相对滞后,人们经常发现,许多有钱人虽然受教育程度并不是很高,却取得了惊人的财富,而有些人虽然大学毕业,甚至读到了博士,收入依然捉襟见肘,这就有了所谓“造原子弹的不如卖茶叶蛋的”说法。

在浙江等市场经济发达的地区,改革开放后崛起的许多富豪只有小学到初中文化水平,但经过自己的努力打拼,生意越做越大。而反观许多名牌大学毕业生,工作之后按部就班找到一份安稳工作,每月领取正常的工资,买房子还需要家里人帮衬,情况真是不可同日而语。

一时间,“读书无用论”甚嚣尘上。

但是,这些观察很可能存在样本选取上的偏差。那些学历不高的富豪往往更容易吸引我们的眼球,但事实上,只有小学和初中文化程度的人何其多,这些富豪可能只是其中的幸运儿。而学历高的富豪同样有很多,尤其是进入21世纪,高学历富豪所占的比例也越来越大。

此外,人们对大学生的期待有时候仍然停留在过去的计划经济时代。那个时候大学生的比例很低,所以能考上大学就如同鲤鱼跃过了龙门,非常难得,但现在的情况早已今非昔比。

读书真的没有用吗?学历真的不值钱?当孩子以“读书无用”来反驳父母逼他们读书的时候,家长们一般都会告诉他们:高学历的人平均来说还是比低学历者挣得多,所以读书还是有用的。

我们以深圳市的数据为例来说明。深圳市人社局每年都会发布《深圳市人力资源市场工资指导价位》,我们来看2018年深圳市公布的学历工资指导价位:

◆ 研究生(含博士、硕士)学历工资指导价位平均值为 12389

元 /月;

◆ 本科学历工资指导价位平均值为 10122元 /月;

◆ 专科学历工资指导价位平均值为 8059元 /月;

◆ 高中学历工资指导价位平均值为 5620元 /月;

◆ 初中及以下学历工资指导价位平均值为 4501元 /月。

从这个指导价里,我们可以看到,研究生的工资指导价几乎是初中及以下文化程度的3倍,一个本科生的工资指导价是初中生的2倍。这时候,家长们似乎就可以用这个工资指导价来教育拿“读书无用”给自己找借口的孩子了:“你看看,读书还是有好处的吧,学历高就是挣得多。”

如果这个孩子足够聪明,他或许可以这样反驳:“那些取得了高学历的人,可能他们本身就比较聪明,而不是学历带给了他们更高的收入,是他们自身的聪明才智给他们带来了更多的收入。现在,我已经知道自己很聪明了,上不上更多的学又有什么用?”

我估计,许多家长如果真的遇到这样聪明的孩子,还真拿他没办法。这个聪明的孩子说的一点都没错。虽然我们观察到学历高的人平均而言挣得收入比较高,但这只是一种相关关系。学历这个变量有可能混杂了许多其他的因素,这些因素你没有观察到,但却把它们对收入所起的作用一并都算给了学历这个变量。这些混杂因素,就是我们一再提起的遗漏变量。

除了个人的聪明才智之外,还可能有其他的不可观察因素,它们都与学历这个因素相关,同时,也对收入水平有影响,在这种情况下,我们又该如何把学历对收入的因果效应单独估计出来呢?

经济学家把教育对收入产生的因果效应称为教育的回报。这个概念强调,教育乃是一项人力资本投资,它能为投资者取得一份与金融投资相似的货币收益。但由于教育与诸多其他不可观察的因素混杂在一起对收入起作用,所以,对教育的回报进行准确的估计,一直是一代又一代经济学大侦探们努力的目标。

芝加哥大学的著名经济学家雅各布·明塞尔(Jacob Mincer)在20世纪70年代是第一个使用回归方法对教育回报问题进行定量研究的人。他把一个人的受教育水平(以年为单位度量的学习时间)以及以年为单位度量的工作经验作为解释变量,来解释人们收入的变化。他估计出来的教育回报是11%,也就是说,一个人的受教育水平每提高一年,可以使平均收入提高11%。

但我们知道,那些受过很高程度教育的人,他们本身可能就比别人更聪明,工作也更努力,对人生怀有更为积极的追求态度,相比于那些在教育过程中未能坚持下来而中途辍学的人,这些因素本身就会对收入水平产生影响。这就使明塞尔的这个估计结果出现了偏误。我们可以认为,11%的教育回报估计结果可能高估了教育水平或学历带来的影响。当然,11%这个结果也可能低估了教育水平的影响,因为我们对那些不可观察的因素实在所知不多,但是,我们知道它们就在那里,并且通过某种隐秘的途径发挥着作用。

面对可能存在的个人能力因素对教育回报估计造成的污染,还有一个办法,那就是尽可能寻找个人能力的代理变量,比如使用智商作为能力的代理变量,从而对个人能力这个因素加以控制。加入智商这个控制变量后,计量经济学家兹维·格瑞里奇斯(Zvi Griliches)使用与明塞尔相同的模型,估计出的教育回报率只剩下6.8%了。虽然这个办法看起来很有意思,也符合我们的预期,但使用智商做代理变量,还是会忽略个人能力的其他维度,而这些因素可能也都会既对教育水平的选择有影响,又对收入的变化有影响。因此,这个办法只是逼近了真相,但它还远没有发现真相。

最理想的办法,当然是做随机控制实验。假设我们现在可以不计成本,不管伦理审查,甚至不顾是否违法,来做一场实验。我们从全国随机选择一群孩子,通过抽签,让有些人只读1年书,有些人读2年书,然后以此类推。假设所有的孩子都按照实验要求完成了规定年限的学业,几十年后,我们再来计算他们的平均收入水平。这样,我们就可以计算教育水平每提高一年,教育回报平均来说大概是多少了。

但这个办法实在太不现实了。且不说这个实验耗时长久,代价高昂,我相信无论是哪一位家长,估计都不会同意让自己的孩子参加这样的人生实验。同时,这样做不但在伦理上说不过去,而且还可能会违犯相关法律。

那么,是不是在估计教育回报这个问题上,经济学大侦探们就束手无策,再也没有办法了呢?当然不是,在这个问题上,我们的经济学大侦探可一直没有闲着,接下来,我们就来看看他们是如何破解这个悬案的。

前面我们提到,影响一个人多读一年书的因素可能有很多,这些因素与多读一年书这个因素一起对收入水平发挥着作用,有的可以被观察到,有些很难被观察到。

如果能够被观察到,我们就可以把这些因素作为控制变量列入回归方程,这样就可以保持其他条件不变,从而不影响我们估计出多读一年书对收入水平带来的影响。

但是,如果这些因素不能被观察到,同时又由于各种原因,无法通过随机控制实验来估计因果关系,此时,要想清楚地识别出多读一年书这个因素对收入水平带来的影响,就会困难重重。

那么,有没有这样一种可能性:假如有一项突如其来的政策,使得某一些人意外地比其他那些人多读了一年书,那么,我们就可以把这意外多读了一年书的人与另外一些人日后的平均收入进行比较,从而估计出多读一年书对收入造成的因果效应。

其实,我们的这个设想,阐发的正是工具变量回归的基本精神。我们这个故事里的工具变量就仿佛是一个意外的因素,它影响着对教育年限的选择,但又唯一地通过对教育年限的选择而对收入产生作用。这就像一把手术刀,清楚地把其他那些不可观察的因素对收入变化产生的作用切除出去,仅仅留下教育年限这一个因素造成的影响。一个好的工具变量,必须满足两个条件:第一,它与我们关心的那个因素相关,在这里就是与教育年限的选择相关,即与是否多读一年书相关;第二,它与其他影响收入变化的因素都不相关。但一个好的工具变量

往往很不好找,这需要大侦探们独具慧眼才行。好在,在多读一年书会带来多少收入回报这个积年悬案上,我们的大侦探找到了一把这样的好手术刀。

1991年,著名的经济学大侦探乔舒亚·安格里斯特和艾伦·克鲁格(Alan B. Krueger)在顶级杂志《经济学季刊》上发表了一篇文章,他们找到了一个神奇的工具变量——一个人的出生季节。

和世界大多数发达国家一样,美国很早就颁布了义务教育法。美国的义务教育法规定:只要当年年满6 岁的儿童,都需要在该年9 月份入学。也就是说,一个孩子如果生日是12月31日,那么,他和生日是1月1日的孩子一样,都需要在当年9月份入学(这一点与中国的入学规定不同,我们是当年 9月 1日之前年满 6周岁的儿童才能入学。如果你出生在 9月 1日,你就比出生在 8月 31日的小孩晚一年入学。而美国是当年只要年满 6周岁就可以在该年 9月份入学,所以 1月 1日出生的孩子就比前一年12月31日出生的孩子晚一年入学)。平均而言,出生在第一季度的孩子,入学时大约是6.45岁。而出生在第四季度的孩子,入学时的平均年龄大约是6.07岁。同时,美国的义务教育法还规定,只有年满16岁,青少年才可以离开学校,辍学回家。

这样一来,那些在第一季度出生的孩子,比第四季度出生的孩子,理论上就可以少上将近一年的学。也就是说,如果一个人的生日是1月1日,那么,在他16岁到来那一年,过了1月1日就可以辍学去工作了;而如果他的生日是12月31日,那么,他就需要上完全年的学才能合法地离开学校,离开课堂。

这样一来,美国的义务教育法就创造了一个自然的实验环境。它把在16岁辍学的孩子分成了两组:一组是生日在一年当中比较早的那些孩子,我们把他们称为A组;一组是生日在一年当中比较晚的孩子,我们把他们称为B组。由于B组的孩子比A组要多上一段时间的学,所以,对于我们估计多读一年书所带来的收入差异来说,B组就是干预组或处理组,那么,A组就自然成了对照组或控制组了。

假如有许多人都是1月1日出生的,也有许多人是12月31日出生的,而这些人都在16岁生日到来那天辍学了,那么,我们把这两组人未来的平均收入进行比较,其间的差别就是多读一年书带来的收益了。在这个研究中,一个人的出生季节或生日,为什么是一个好的工具变量呢?

首先,两位大侦探要确定的是,会不会真如我们这里所讲,有一部分孩子在16岁生日到来后就辍学?也就是说,如果一个孩子的生日在1月1日,他会不会真的比那些出生在12月31日的孩子少上一年学?幸运的是,两位大侦探通过数据分析确定,情况确实如此,的确有一部分孩子在16岁辍学,而且他们的生日会对辍学时间的选择有着显著的影响。

那么,两位大侦探接下来要确定的第二件事,就是确定生日与其他那些影响收入的因素不存在什么显著的关联。一个孩子出生在哪个季节或者月份,或许纯粹是一种随机的结果。即便有人选择让孩子在某些季节出生,恐怕也很少有人会出于让孩子长大后赚到更多钱的原因这样做。如果真有哪个季节可以让孩子将来赚取更多收入,我相信家长们一定会扎堆把孩子生在那个季节,这样我们也一定能从数据中观察到这样的现象。但事实是,我们从来没有看到过这样的扎堆现象。

经过对这两点详加验证之后,两位大侦探让我们确信,一个人的出生季节或月份是一个好的工具变量,它可以让我们把多读一年书对未来收入造成的影响,与其他因素对未来收入发挥的作用区分开,从而干净地识别出多读一年书对未来收入的因果效应。

大侦探安格里斯特和克鲁格分别搜集了美国20世纪20年代、30年代、40年代和50年代出生的孩子在1970年、1980年的收入信息。由于20世纪40年代和50年代出生的孩子上高中的比例已经很高,所以,16岁即辍学的人数相对较少,再加上在这代孩子成长的时代遇到了越南战争等外部事件的冲击,同时,收入信息也只到1980年,所以他们主要比较了20世纪20年代和30年代出生的孩子出生季度的差异对收入造成的影响。对于20年代出生的孩子,使用的是1970年的收入信息数据,此时他们正好处在40~49岁之间;而对于30年代出生的孩子,使用的则是1980年的收入信息数据,此时他们也处于40~49岁之间。

两位大侦探发现,对于 20 世纪 20 年代出生的孩子来说,第一季度出生的人比其他三个季度出生的人少上了 0.126 年学,教育回报率要低0.7 个百分点。对于 20 世纪 40 年代出生的孩子来说,第一季度出生的人比其他三个季度出生的人少上了 0.109 年学,教育回报率要低 1.02 个百分点。

安格里斯特和克鲁格真是发现工具变量的天才!他们这个巧妙的研究设计,一下子帮我们破获了多读一年书到底能带来多大收益这个多年的悬案。他们的这篇文章被奉为经典,简称“AK91”(A和K分别是安格里斯特和克鲁格的姓氏首字母,这篇文章发表于1991年),成为后来学习工具变量方法的学子们不断阅读和研究的典范。