如何让机器写出喜欢就会放肆,只有爱才会克制这样的句子

喜欢就会放肆,只有爱才会克制。看到这样的句子,我在想自己能不能也写出一些这样听起来有道理的金句了。之所以这么想,是因为觉得这是一种放诸四海而皆可的思考套路,你想要搞清楚信息是什么,那就要区分和信息差不多的几个词语,比如消息,信号,搞清楚这些词语之间的区别是什么,你就明白了信息的本质。同样的道理,你想弄明白什么是智慧,就要搞清楚智慧和聪明的区别。即了解一个概念,从分辨出和这个概念相似的概念和相反的概念开始。

给定了一个你想了解的概念,比方说成本吧,你找到这个词的近义词“本钱”,找到了这个词的反义词“利润”,接下来要做的是追本溯源,看看在语言的进化历程中,这三个词最初意味着什么?起源于那本书?当时的语境是怎么样的?每个词各自的含义又因为那些社会因素的影响,发生了什么样的变化?不止要探查一个语言下这些词语的区别,最好还要看在不同的语言下,成本(cost)这个词的变化。不止要看语言,还要看在不同的术语体系,比如经济学中讲的术语和普通人理解的术语有什么不同。

做好了上述的功课,就可以去试着写写豆腐块式的小文了。然而我关注的是思维套路,在最近一期的东吴同学会上,我就听到权利和魅力的区别在于权力会随着时间耗散,而魅力会成为时间的朋友。这样的洞见从何而来,除了依靠个人的观察和积累,能否利用大数据从中得出启示了。这符合我一直提倡的观念,利用算法来辅助人来进行认知和决策。具体到这个场景下,就是我拿到了一个词,我希望算法能从我给点范围的文本库中找出和这个词相近的几个概念,然后指出不同概念的区别。

为什么这么做是可行的?那是因为概念和概念之间的联系,本来就隐藏在文本之中,通过词向量的方式,就可以定性的判断几组词之间的联系,比如你给定足够多的文本,让机器来判定爱和喜欢这组近义词,与放肆和克制这俩个词之间那俩种组合联系更紧密,那么取决于你给出的文本,若你用来训练词向量的是一堆小黄文,那么爱就和放肆连接,若你给的训练文本是红楼梦中宝黛之恋的桥段,那么爱就和克制的关系更紧密一些。虽然我不清楚具体的实现,但以我的理解,这样的应用是可以实现的。有做自然语言的朋友,可以留言和我深入讨论。

那这样的工具有什么应用了。举两个实际例子,在股票市场上,如果能根据一个上市公司的信息,找出和这家公司相近的公司,然后再列出这些公司各自的关键词,并突出展示这些公司的不同之处,那么这样的展示,能不能帮助投资者更好的了解一家股票了?这我无法给出答案,但这至少是值得调查的方向。而对于想快速读完一本书的人,上述的工具,能够根据这本书中的关键词,并对比当前常见的语料库中对这个词的理解,列出这个关键词和其他关键词的不同之处,比如《离经叛道》这本书的关键词是创新,那么根据常见的语料库训练出的神经网络中,和创新关联的词语就不会有拖延,而会有风险偏好强。而《离经叛道》这本书就是想打破就是这两个的被人们普遍抱持的观点。如果算法能够将创新和拖延连接起来,并觉察出这和普通观念的差别,那么这有助于自动生成更准确概括书籍/文章大意的摘要。

总结一下,厘清概念和术语是我们学习任何一门学科都绕不过的基本功,而要做到这些,我们需要的是分清楚一个概念和其相近的概念有什么区别。由于人们在使用概念时的语境,会反映出这个概念和其他维度上的概念有那些不同,所以通过统计学习的方法,可以让算法来分析大量的语料库,给出代表相近概念的不同词语之间的差异,从而帮助我们高效的学习。

原创不易,随喜赞赏

/pic/1_vHVmC19a0o7YS03eqTrIL9QJS4wS4w.jpg

扩展阅读

以概念为中心 升级思维系统

读小说,做学问,都需要抓住正反和两个方面

清2017-09-24 14:05:29

权利≠权力

生活物语2017-09-23 08:28:37

到底是让机器去创新呢还是让机器根据已有的数据去分析去优化呢?

作者

让机器帮助你去思考

呆呆2017-09-22 18:09:42

论道讲法智者有界个中人,召圣通灵创者无疆台上戏。我想机器能够有举一反三,触类旁通;融会贯通,为己所用的学习思维时,就可以写出喜欢就会放肆,只有爱才会克制这样的句子。