从前慢背后的道理-读《Theefficiencyparadox》
“从前慢”这首歌之所以能打动那么多人,是歌词中点出了当下普遍流行,又未曾言说的一种时代病。今年4月17号出版的《The effeciency paradox》这本书则系统性的讲述了为什么对高效的执着反而会带来低效。这本书一开始评判性概述了同类型的其他作品的内容(其中不少是我曾读过的书,参考黑镜书单-列一列那些反思互联网和人工智能的30本警世之书),并总结大数据的七宗罪(我之后会总结为六种)。之后的五章,分别从平台经济,搜索引擎,教育,自动驾驶,医疗领域入手,分析为什么只追求高效率会适得其反,在最后一章,作者提出了6种相应的解药来帮助我们更好的和大数据技术相处。
你也许会问我为什么还在读这些冷门的作品,而不去关心更值得关注的事情,比如中美贸易战。关于这个问题,我想说之所以能够有贸易战,那是因为美国做之前做错了选择,才给了中国足够大的贸易顺差,如果对手不犯错,弱者无法战胜强者。但如果对手犯了错,你却不知道,还跟着错,就是没有利用好自己的后发优势。
阅读这本书的时候,我不止一次的想起索罗斯的反身理论,这个本来描述金融市场的概念指出投资者与市场之间的必然互动影响,投资者根据掌握的资讯来预期市场走势并据此行动,而这反过来影响了市场原来可能出现的走势。反身性的存在在效果上如同量子力学中的测不准原理,指出了本书的副标题,即“什么是大数据做不到的”,记录数据这件事会改变数据本身,如果仅仅以数据来衡量效率,那你可以在你试图拟合的数据上达到最优,但在更广泛的视角下确实低效的。类似机器学习中永恒的魔鬼过拟合,对高效的追求基于的是在过去这些指标是有意义的,但这些指标一旦变成金科玉律,最初的假设就不存在了。
在系统性的分析之前,先让我们看两个日常生活中的例子,比如共享单车,本是想提高出行的效率,却占据了人行道,造成了大量资源的浪费;网购本来可以减少仓储的成本,减少购物的时间,但却带来了很多碳足迹更大的小包装以及不必要的冲动消费。对于学术界的人,发文章的任务使得他们不会试图去做那些风险很大或者非主流的研究,而专注于一个个短平快的项目,在教育领域,能够监控学生表情的智能识别软件本来想通过给老师提供即时的反馈来更高效的教学,但我想这也许只适合表演系的学生。智能手环提供的数据并不能让我们更多的运动,而步数排名则会让我们焦虑。
肯尼迪说GDP只是个数据,“它能衡量一切,却把那些令人生有价值东西排除在外”,这段话半个世纪之前的话,其实已经预示了大数据驱动的效率带来的6种危害,毕竟这半个世纪以来的逻辑是类似,改变的只是技术,不是运行技术的心态,让我们再看一遍这段话,看看能从中想到大数据的七宗罪究竟是那些?
然而这个国民生产总值不包括我们孩子的健康,他们教育的质量和游戏的快乐,他们GDP也不包括我们诗歌的美丽,我们婚姻的坚强,我们公众辩论中的智慧和我们官员的政治,同样GDP并不包括我们的机制和勇气,不包括我们的智慧和学问,不包括我们的同情心,也不包括我们对国家的热爱,总之这个生产总值衡量一切却把那些令人生有价值的东西排除在外了,他告诉我们美国的方方面面,却不能告诉我们为什么为它自豪。
游戏的质量对应是意外的价值,当你外出的时候,旅游攻略让行程中的惊喜变得稀缺,但正是这些意外让我们从旅游中开阔眼界,而科学中的很多新发现也来自意外。信息订阅让你能够花最少的时间知道天下大事,但却不会让你有阅读报纸时在不关注的板块找到新知的喜悦
公众辩论中的智慧对应的是公共空间的消失,信息的高效传播使得不同的意见之间者无法有效的沟通,也使得不同学科之间的学者之间壁垒越来越高,越来越少的人关注整体。对单一指标的过分关注,使得极端的手段不再是行动的禁区,底线的突破总伴随着执念的固化。
智慧和学问指的是技能的退化,GPS的普及使得人们无法阅读地图,屏幕前的高校浏览不鼓励批判性的阅读,搜索的便利让人们忘记了你首先需要知道你要找的是什么,才能判断搜索得到的信息有没有价值。计算器的普及让心算变得无用,但却无法替代心算训练带来的数学直觉。
同情心指的是一个单一的价值观,生物学家做实验的小老鼠是无菌的,是基因上一模一样的,这本来是为了提高实验的效率,但这样非自然的坏境下得出的结论不能推广,反而造成了浪费。高效的系统运作需要有相同的价值观的一群人,但这却会在整体上带来低效率。
我们的机制对应着大数据带来的自我实现的预言。淘宝店花钱买好评是因为店主相信花的钱是划得来的投资,但当所有人都这么做的时候,整个系统就变得没有价值。给学生最适合他们当下水平的习题,那差生就永远会落后。而勇气指的是当数据驱动的指标决定你的升迁时,你会不会选择做正确的事,而不是正确的做事。
而大数据带来的最后一个危险,对应肯尼迪话中的“生产总值衡量一切”,为了能够做到衡量一切,海量的数据被生产出来。书中举了美国医疗行业的例子,细致的医疗指南让医生们需要花费更多的时间用在文档工作上,减少和病人面对面交流的时间,看似提高效率的措施却使得医疗变得低效。
在预估未来时,我们常常忽略未来十年的变化,但回想十年前的08年,我也是用着笔记本电脑,塞班手机。为什么这十年并没有给我们带来根本性改变,而只是让我们活得更像美丽新世界和黑镜中描述的那样了?只是我最近为什么总在读反思互联网的书籍的原因,这十年来科技界风起云涌,但创新大部分集中在更高效的分蛋糕,而不是做蛋糕上。我认为这才是为什么美国衰败的真正原因。而这个教训值得每个人记住。
最后我们看看作者给出的六条关于如何更高效的使用大数据的建议,一是平衡数据和直觉的判断,能够更好的找出隐藏意图的是人,能够在矛盾的需求中找出平衡的是人,不要轻易的交决策权交给数据,在决定生死的领域,人要保有不那么高效的技能,以免机器失效后没有备份。二是重视面对面的交流而不是在线的交流,面对面看似低效的交流带来的创意胜过在线远程交流表面上的高效。三是鼓励有创意的去浪费资源,那怕成功的机会不大,但只要成果足够革命性,就应该去积极尝试。四是在传统媒介中寻找随机性,比如去阅读看似和当前行业没有关系的杂志,比如这篇文章中通过肯尼迪的名言来引出大数据的问题。五是主动去追求困难,比如在手机上阅读时将字体经常改变,能够降低阅读的速度,但却能够让你记忆更深,而让付款如果不是刷脸指纹这么方便,而是要打出一串字母做密码,将会减少冲动消费(如果你将密码设成BuYaoDuoShou效果会更好)。最后一个建议是congnitive boostrap,这很难翻译成中文,但了解机器学习在boostrap和begging的会很容易理解。面对一个不熟悉的领域,你学习是不应想着读完这个搜索结果中的前十篇文章(数据上最高效),而是从一个靠谱的综述开始,阅读这篇文章引用了那些文章,读完引用的文章后在再来读最初那一篇,或者用你学到的知识来改进你的搜索,如此重复的取出一部分信息,内化成知识,再去找自己不那么熟悉的知识。
不管是大数据,深度学习,区块链,基因检测和编辑,任何一个潜在具有革命性的工具都会有被滥用的风险,我们要做的是在这些技术被滥用之前找到问题所在,好的医生能够再病势还没有深入骨髓时就及时干预。而只有能越精确的定义清楚问题,才能够更高效的解决问题。解决方案不必是非黑即白的回到过去,而是拿来主义的改变心智模式,运用工具而不是成为工具的提线木偶。
更多阅读
让互联网更有人情味-读《Technically wrong》
人的价值在于提问-读《Human are underrated》
何晓星2018-07-08 19:08:40
请问这本书哪里有卖呢
作者
还没中文版
东方昊2018-07-09 16:52:36
我的理解是数据是抽象出来用来拟合的指标,但网络时代的人们却把数据本身当做了目的。以学习为例,本来追求的是学到了什么并且有什么感悟,却被转化为读了多少书,写的书评有多少赞这样的指标。追求的与其说是高效,不如说是对数据的迎合,忽视了现实性。这可能与系统过大使人失去现实感有关。
张南云2018-07-08 21:33:42
倒数第二段:bootstrap and begging. 是否应为bootstrapping and bagging
作者
是的