鲁棒特征与该怎么更好这一生
2020 世界不太平,新的十年里,对大趋势的关注,让我在开年的时间里,聚焦于俩本书,一本关于全球变暖的《The unhabitable earth》,另一本则关于老龄化。该书的作者是研究衰老的哈佛教授在19年出的,名为“Lifespan”,书的前半部分写关于衰老的科学,后半部分写衰老研究带来的可能社会影响。
看到专家对比中日两国的老龄化,说中国最可怕的老龄化是未富先老,但我觉得,真正可怕的是老人过的没有人样。老人不仅无法为社会创造价值,还成为最容易被收割的群体,;老人不仅不能成为智慧的灯塔,反而成为谣言和伪科学的温床。老龄化真正可怕的,其实是失去了可塑性的头脑,和日渐无法自理的身体。如果老人都能像今年的诺奖得主Goodenough那样,老龄化是好事而不是需要担心的。
Lifespan这本书把衰老看成需要被治愈的疾病,一种由于信息传播中的错误累积而造成非必然结果。避免衰老其实很简单,少吃,多动,但这都是反人性的,说起这个话题,就会让我想起青年时读鲁迅笔下的九斤老太,想起史铁生在《我与地坛》中写的:“也消灭恐慌呢?还是保留欲望同时也保留人性?”,五年前在公众号刚开始办的时候,我就写下真正的自由来自对自我的限制,是和自己订立契约。”如此这样想来,多想几层,就会陷入存在主义的危机,如果人真的活得如同机器一般,那我们身上的人性又还剩几分?
回到这篇文行文的主线,新年里特意选择了俩本“灰犀牛”类型的书来读,是想看看影响未来长期的俩大趋势。由于是未来几十年之后才会出现的危机,因此即使有改变的办法,人们也多半不愿意采取,因为这些措施都有些“反人性”,但反人性这个词究竟意味着什么,我们谈到反人性的时候,那份负面情感又是从何而来。
谈起人性,会想起尼采的骆驼狮子和孩子的分类,朋友们谈到的反人性,说的是不是从“你应该”到“我想要”这个跃迁,每一次反人性的建议,其实就是要看到的普通人,与一次次的与进化带来的先天禀赋或者商业巨头的利益进行一场大卫和歌利亚之战?
对这个问题的回答,我想最好的办法是给人性找一个原点,一个公理性的基础。下面是我对何为人性定下的三条公理:首先是人都想过好自己的生活,其次是人性分为很多层次,在不同的领域会展现不同的样貌;三是人的主观快乐与否取决于个人对自我有一个完整而协调的认知。
从这里出发,我将过好这一生分为了三个层面,物质生活,情感生活与精神生活。不同于汪丁丁的分类,由于物质的产生从根本上是社会性的,当今根本没有什么手工小作坊,因此我将社会生活中,涉及到切身利益的一面,归到了物质生活中,而将社会责任感归到了精神生活中。下面是思考的结果,分别涉及在这三个层面上,如何过好这一生。
在涉及到自身物质性的一面,我想要过的顺心,就需要像一个骆驼负重前行,听从统计数据的建议,当科学告诉你要锻炼的时候,你不要以我想要为借口任性;当经济大势告诉你需要转行时,也不必怨天尤人;而在情感生活的层面,你要做的是像个狮子,去创造新的价值,不要因为没有追求流行而恐慌,不要被外界大喇叭中的“你应该”而束缚,最重要的是不逃避自由。而在精神生活中,你要像一个孩子,无拘无束,质朴,老老实实不刷花活,向世界展示你柔软的一面。
本来这样一篇个人的心路,我是不打算公开的,但今天看关于计算机视觉中的adversarial training相关的技术博客,忽然有所领悟,觉得这样俩个看似不相关的问题,竟然能够联系起来,实在有趣,忍不住将这篇发出来。
参考文献:
http://gradientscience.org/adv/
http://gradientscience.org/adv.pdf
(感兴趣的去看这俩篇文献,文中讲到的不仅适用于计算机视觉,对于强化学习面对的policy上的脆弱,更为适用)
所谓adversarial training,指深度学习的图片分类器,能够通过在原有图片中加入人眼无法识别的噪音,就让分类器错误的做出分类,例如下图中,左图被分类器识别为狗,右图被识别为喵。
深度学习的系统能够被定向的微小噪音攻击,这通常对研究者来说是需要克服的噪音,但这篇文章的思路是将其看成一种值得研究的特征,正如该文的标题指出:“Adversarial Examples Are Not Bugs, They Are Features”。我们看到的这些加入后能够改变模型预测结果的噪音,是完全无意义且非自然的吗?本文将模型的输入分为了鲁棒的和非鲁棒的俩类,如下图对分辨猫狗来说,耳朵,嘴巴是否撅起来是鲁棒特征。
由此,我想起了之前写到的关于人怎么才能过好这一生的问题。很多人之所以觉得很多道理是反人性的,是因为对他们来说,这些道理是non-robust的输入特征,人的幸福感,来自于对自己的一个完整自洽的认知,如果你说的道理,哪怕有再多数据与逻辑支持,只要有悖于与其对自身的认知,那么他就会觉得这是反人性的。
在该论文中,研究者将训练数据分为俩类,一类是不管加不加特异性的噪声数据,都能够获得好的分类结果的,如上图;另一类则是哪怕只要改变几个像素,就不会分类为青蛙的图片。对于图像分类来说,这个实验说明:深度学习模型面对adversiral attack的脆弱性,不是由于模型本身的问题,而是来自缺少先验假设的特征处理及数据集。对于个人来说,思考该怎样活着的问题,就是去分辨那些数据是鲁棒的,那些是像上图中的噪音点那样,被构建成恰好能获得这个分类。
而思考的结果,是找到那些鲁棒性的特征,也就是在环境发生变化时,仍然能让你在面对世事纷纭时不慌乱的信息过滤原则。上图展示使用上一步找到的鲁棒特征的前提下,即使狗的照片被标记为猫,使用这样错误的训练数据训练出的模型,也能够将猫正确分类。这对人生的启示是如果能够在信息输入时,提取出对何为好生活,何为正确万古不变的特征,即使你生活在一个指鹿为马的年代,你也会活的快乐。
如果使用错误标记的标记的训练数据集得出的模型,在真实标记的测试数据上,如果只使用鲁棒的特征,就不具有泛化能力(掌握了鲁棒信息过滤器的人,能够学会在指鹿为马的年代保持沉默)。而只使用非鲁棒的特征,则模型仍然可以泛化,得出正确的分类。这说明深度学习的模型,的确会用到了非鲁棒的特征,即使在存在鲁棒特征时,且仅仅使用非鲁棒特征,也能让模型具有泛化能力。这意味着模型本身是无法区分特征是否具有鲁棒性的,由此,对模型的解释不应该只关注鲁棒性的特征,不应该只关注训练后的模型,而应该考虑模型训练的过程本身。之所以模型无法通过训练,区分鲁棒特征与非鲁棒特征,我的理解是因为深度学习的模型都没有先验知识,也不具备因果模型。
对于个人来讲,无法区分鲁棒特征与非鲁棒特征,是人没有成熟的表现。关于何为鲁棒信息过滤器的思考,怕是和如何过好这一生一样,是一个需要活多久就要思考多久的问题。这篇小文从何为反人性说起,谈到了鲁棒特征,思维的跨度实在有些大,愿意看完的应该会很少,不过写作是精神生活的领地,因此要表现的像个孩子一般。
更多阅读
JerryLi2020-01-11 18:33:48
这篇写的真好[强][强]
作者
竟然有人能看懂。。
颜桥2020-01-11 19:55:28
真能写,史铁生都出来了。西门庆才是最具备鲁棒性的 人
格鲁吉亚菜包子2020-01-11 18:51:03
这跨的界对我而言有点宽,不过看了快三年的巡洋舰,最喜欢的也是这一特点–不断拓展我作为一个商科生的自我边界,并保持对世界和阅读的兴趣 个人很认同一个人的快乐,满足与否,决定于其内部的自洽。“人的幸福感,来自于对自己的一个完整自洽的认知,如果你说的道理,哪怕有再多数据与逻辑支持,只要有悖于与其对自身的认知,那么他就会觉得这是反人性的。”
c1372020-01-13 14:49:06
真好
梁 Liang2020-01-12 03:25:12
建议作者把那些"我是不打算公开的"文章,继续适当发一些出来,让心有灵犀的读者们有机会品尝这些精神盛宴。。。
雪翔2020-01-11 19:50:18
建议区分一下鲁棒、自适应、鲁棒自适应、自适应鲁棒,看能不能对人性、反人性再细区分。
qq2020-01-11 19:44:10
孔子曰:邦有道,则危言危行,邦无道,则危行言孙。这样的人就像是掌握了robust feature的人。然而同一个feature对于不同的人可能会是完全不同的robust和non robust feature,比如自律,少吃多动,有的人甘之如饴,有的人却深恶痛绝,这是不是也算是可以把人分类的feature
润物语RunStory2020-01-11 19:11:08
先不谈感情生活和思想生活,谈谈物质生活:根据科学等,来实现价值最大化。当然还是会有冲突,起码有短期利益与长期利益的冲突,比如睡懒觉与起床锻炼,一个短期利益去,一个长期利益。这时候会觉得人性就是选择短期利益。我觉得按照作者的意思是:产生这种冲突是没有在思考生活的过程中找到基准点;前面的冲突是讲一时享乐与身体健康比较,标准不统一,可能要找个更好的点来判断(鲁棒特征),比如这里,可能是想让人生充满元气,就选择早起锻炼。这个判断标准需要不断思考,还要真正说服自己与自己的身体。虽然我觉得找到好的标准和做到知行合一都挺难的,但还是感谢作者撰文。 如果理解不对,希望指教。
作者
这个理解不错!
唯尔 Will2020-01-11 18:52:20
关注作者的都是同道中人hhhh
面无表情2020-01-12 02:03:48
写得真好!物质生活情感生活精神生活对应于柏拉图在理想国里提出的欲望激情理性。不够成熟的我最近也在思考外界输入对我的影响,不加筛选地过别人想要我过的生活只会给自己带来痛苦。所以本质上就像文章说的,要有鉴别“真理”和“意见”,即鲁棒性特征与非鲁棒性特征的能力,而相信何为真理,可能就是我们作为人这个分类器所需要的“先验知识”吧。欢迎讨论!
baochun2020-01-11 22:51:58
鲁棒性和泛化能力都重要,训练-测试-反馈-迭代-螺旋循环
光之国2020-01-11 21:31:50
这篇不错,给了我一些指引,对我目前确有帮助,感谢铁哥,尽了绵薄之力,只是觉得确有价值的东西应该有回报,虽然我囊中羞涩
粥2020-01-11 20:01:31
看到adversarial training之后就有点儿生涩了。因为没有任何专业背景,可能过阵子再看一两遍试试。但就在那之前的一个段落,已经让我觉得很好,很好、谢谢
Yvonne2020-01-11 19:38:22
Mark下这一段:要顺心,涉及物质性时,就需要像一个骆驼负重前行,听从统计数据的建议,当科学告诉你要锻炼的时候,你不要以我想要为借口任性;当经济大势告诉你需要转行时,也不必怨天尤人;而在情感生活的层面,你要做的是像个狮子,去创造新的价值,不要因为没有追求流行而恐慌,不要被外界大喇叭中的“你应该”而束缚,最重要的是不逃避自由。而在精神生活中,你要像一个孩子,无拘无束,质朴,老老实实不刷花活,向世界展示你柔软的一面。
黄守卫2020-01-11 19:29:00
人性的定义太浅层。应该是人本质上要体现什么,本质上的意向是什么
flying2020-01-11 19:07:51
用“本质”替换“鲁棒”会不会看懂的人更多一点。