经由因果分析,反驳AI监控学生上课,及辨别健康类谣言
想象这样一个场景,你和你心爱的女孩一起自习,你的理科好,于是你看着她听数学的网课时,有时露出困惑的表情,还有时会走神。然后等她听完,你再把你觉得她没有听懂的部分,给她换一种方式讲出来。然后女孩反馈,你讲的正是她不懂的部分。
上面的场景很温馨,然而类似的设定。如果监控者是AI,结果就是教室变成环形监狱,不管是学生还是教室,都被死死的锁定在系统中。没有人愿意在被监控的环境下创新或者深思,于是教育沦落为了死记硬背。
我们想要的AI+教育,是想让每个人都能有一个智能助手,如同第一个故事中的那个恋人。但当前的AI却只能做到后者。不管大家是否愿意,如果AI界不发生一场U型的大转向,我们未来都会生活在算法的监控下。
之所以AI+教育变成了如今这般恐怖的模样,是因为当前算法只能识别相关性,无法区分因果性。孩子上课走神,可能是由于课程对少数孩子太简单,更有可能是讲的内容太难懂;但如果只考虑相关性,那就无法做到具体情况具体分析,从而忽略了前一种情况。
当前AI+教育的逻辑,是上课说话,睡觉和学习成绩下降相关,因此要防微杜渐,及时向家长老师反馈,这样就有更有可能提高整个班的成绩。而若是爱你的人发现你上课没有专心听,她会听你讲述,和你一起分析为何你上课没有专心听讲的原因。由于当前的AI技术及其背后的应用逻辑都是建构在相关性上而不是因果分析上的,因此才会出现这般的南辕北辙事与愿违。
相关性的分析,关注的是偏好,这个孩子上课爱说话,那个孩子上课爱睡觉,找出这些风险因素,就能提升平均成绩。而爱你的人和你一起找原因,是想要提升你的能力。偏好和能力的对比,是本文下面的例子要着重强调的。
如何活的健康是每个人都会关注的话题,然而越是这样的问题,越需要铭记相关性不等于因果性。考虑下面三个关于健康生活方式的最新研究成果:
1)午休太多,患代谢类疾病的风险上升
午休对很多人都不陌生,然而,有些研究指出午休是否会引起诸如糖尿病这样的代谢类疾病。不过这些研究,忽略了午休的时长这一关键因素。在今年10月22日的自然子刊“欧洲临床营养学”的论文[1],指出午睡和代谢类疾病风险之间的关系,比想象的复杂。
根据对3236名中年参与者的体检及面对面访谈,将其分为四组,分别是午休超过1小时,午休半小时到1小时,午休半小时以下,以及从来不午休。研究发现,相比从来不午休的组和午休时间一小时以上的组,午休半小时到一小时的组的人患诸如糖尿病这样的代谢类疾病的风险最低。
2)吃辣椒的人各种死亡率下降20%以上!四川人乐了!
美国心脏学会2020年,基于来自美国、意大利、中国和伊朗57万多人的数据,其中包括参与者的健康结果以及辣椒消费数据,进行大数据研究发现:
相比吃辣椒的人和很少或从不吃辣椒的人,结果显示,与很少或从不吃辣椒的人相比,吃辣椒的人:心血管死亡率相对降低26%;癌症死亡率相对降低23%;全因死亡率相对降低25%。
3)走路快的人心血管疾病风险低
10月30日的自然子刊“communications biology”中的论文“,根据英国45万欧洲裔40-69岁的健康英国人被试自述的步行速度,分为慢走,即步行速度在4.8公里以下,中速,即4.8-6.4公里和快步走,即6.4公里以上。之后发现,走路速度快的那一组,心血管疾病的风险最低。
看了这三个研究,你会得到下面的结论,要想活的久,活的健康,你应该:
1)午睡只睡半个小时到一个小时2)多吃辣椒3)走路速度快一些
然而,这三个建议,第一个不对。这项研究的作者指出,之所以出现这样的关联,是因为有一个共同的原因,也就是那些从不午睡或者午睡时间太长的人,身体的代谢调控能力已经不太好了,才导致午睡时间过长或过短,这同时导致了代谢类疾病患病率增加。改变午睡时间,不能增强身体的代谢调控能力。
而对于第二个建议,虽然辣椒中的主要成分辣椒素在其他研究中被发现具有抗氧化和抗炎作用,但这不足以解释吃辣椒和诸多疾病患病风险降低之间的相关性。由于目前尚不清楚可以解释上述发现的确切机制,还不能得出多吃辣可以延长寿命的结论。有可能是味觉偏好辣味的那些人,觉得自己更加强壮,因此活的长。让本来不吃辣的人吃辣,不具有这样的效果。
只有第三个建议是对的。为了判定走路速度和心血管疾病风险之间的关系,是否为因果关系,研究者通过孟德尔随机法,利用找到的和快步走有关的基因突变位点作为工具变量,论证了通过提升步行速度,能够降低心血管疾病的风险。
进一步的研究指出,之所以会出现快步走心血管疾病风险低这一现象,是由于快速行走会带来BMI的降低,进而降低了心血管疾病风险。
这项研究还发现步行速度和教育水平,肺活量,握力都呈现正相关。能够快速行走,前提是全身的肌肉力量充足,这解释了为何步行速度会和握力,肺活量有关。而和教育水平的相关性,则是由于更自信导致教育水平相对较高,而更自信的人也会觉得自己走的更快(实际也大多走的更快),两者之间存在一个共同原因。这意味着你下次看到一个快步走的人,据此就能够据预测其在上述方面,相比人群平均水平表现更佳。
之所以上述的三种健康建议,有的正确有的错误有的不确定,首先是因为相关不等于因果,只有论证了因果关系存在,才可以据此给出干预建议。其次,是由于前两个建议都可以归为偏好,而后一个则反映了人具有的能力。偏好是被身体状况和先天禀赋决定的,而能力是能够作用于身体状况的,即存在信息传递。
从这三项研究,还可以得出的另一个更为通用的结论,即如果想做些改变,以便让自己变得更强大,不应该去模仿强者的性格或者喜好,而要努力获取强者具有的能力。前者更有可能只是由于共同诱因导致的相关性,而后者才有可能是因果联系,尤其考虑到能力的提升,会带来对自我认知的改变,会形成正反馈的良性循环,越自信,越愿意点亮更多的技能树。
Take home message:
未来的AI一定要更关注因果关系,之后据此给出个性化建议,赋能个人,而不是找到更多的相关性,再据此将每个人至于环形监狱中
更多阅读对撞因子和伪相关性
从信息传递的视角看因果关系
因果推断让大数据更有温度
1 Zhao, X., Cheng, L., Zhu, C. et al. A double-edged sword: the association of daytime napping duration and metabolism related diseases in a Chinese population. Eur J Clin Nutr (2020). https://doi.org/10.1038/s41430-020-00777-22 AHA Scientific Sessions 2020. P1036 - Impact of Chilli-pepper Intake on All-cause and Cardiovascular Mortality - A Systematic Review and Meta-analysis.3 Timmins, I.R., Zaccardi, F., Nelson, C.P. et al. Genome-wide association study of self-reported walking pace suggests beneficial effects of brisk walking on health and survival. Commun Biol 3, 634 (2020). https://doi.org/10.1038/s42003-020-01357-7
陶静2020-11-15 10:30:14
教育科技专业来答一波。现在AI教育还有一个问题就是好测量的指标如“观看时间”,“坐姿”都不能真正地衡量学生的“参与度”,“认真情况”。量化的指标应该只是作为老师上课判断的辅助。
吸引子2020-11-14 08:48:44
关注因果背后更应该关注复杂系统,同一表象结果可能有不同原因,平时生活也不可能搜集大量数据做研究得出结论,而单纯信数据往往又会把人带偏,不仅有数据归纳头脑,演绎的头脑一定不能少,虽然都不很完美,但两个头脑合起来更接近完备
未纪2020-11-15 05:22:04
寡头权力体系下,会要求subjects们低自尊,高功能。更应警惕的教育机构会利用意识形态的便利而架构的军事主义的高功能体系。高攫取而低成长。这些都会让社会关系走向稀缺+相互不信任+对抗。而非分享和相互学习成长。赞 2