AI距离有创造力还有多远-读《天才与算法》

**《天才与算法:人脑与AI的数学思维》**这本书是美、英两国双料院士马库斯·杜·索托伊先生巅峰作品。我们即将进入一个由算法主导世界,AI将在绘画、音乐、写作等向人类发起挑战,作者用数学帮我们理解算法及创造力的本质。

/pic/1_MhkgiaxSD8DB8686UwXFhicI8xlJew.jpg

书中首先定义了创造力的三个要素,新的,意外的,有价值的。刘慈欣的“诗云”中的列出了所有诗歌可能组成的外星文明,按照这样的标准,不算在诗歌创作中展现出了创造力,因为列出了所有的可能,就没有意外了。而价值这个主观的评价,说明了创造力不是随意的涂涂抹抹,而是带着枷锁的舞蹈,价值的多少会随着人的喜好而改变,而人的喜好又可以在不自知的情况下被操纵,例如操作的米国大选的剑桥分析。
书中接着将创造性分为了三种,组合型,探索型与革命型。狮身人面像是组合型的创意,读武侠小说,总会有人争吵郭靖和张无忌谁的武功更高,再YY一段,这就是探索型的创作,而革命(transformative)型的创意,则是创作出一种全新的艺术流派。当前AI与创造力相关的进展,更多集中在前俩者上,但人们往往对正在发生的范式改变一无所知,直到变化彻底取代了前一个范式,有谁能说,现在AI在创造力上取得的成绩,本身不是一场革命(transformative)型的巨变了。
人们判断机器在某一个领域,是否具有创造性,传统上采取的是类似图灵测试的方式,看其的表现是否能够模拟人类的专业人员,例如如果职业画家都分不出这是不是机器的画作,大多数人听不出这首曲子是算法创作的,或者一篇新闻稿是不是机器写的,那就说明机器在该领域表现出了创造力。在书中,作者指出,关于创意,不应该采取这样人类中心的做法,例如在AlphaGo和李世石的第二局棋中,alphaGo走出的一步是人类棋手根本想不到的,无法通过上述的图灵测试,事后却被证明是制胜一子。根据之前提出的创造性的三个要素,这其实是最高级的革命性的创意。读这本书的一大收获,就是改变了我们对何为创意的判定方式。
书中作者在先讲了推荐系统,搜索引擎这些我们日用而不自知的系统背后原理,以此来论述在操纵人们的所思所想方面,机器不过是执行编程的人的意志,是一个更自动化的打字机,而不是会自己创作的神笔。之后分绘画,音乐,文学三方面讲述了几十年间各种不同方式的尝试,由于作者的主业是数学家,书中很大的篇幅在论证机器是否能在数学上展示出创意,书中写的最精彩,信息量最大的,就是这几个章节。
先看绘画,首先是分形艺术,这是只有机器能够产生的复杂图像(参考16张gif图带你认识分形(fractal)),其次是用对抗生成网络去学习某位大艺术家的风格,去批量的生成模仿类的作品,例如风格迁移(参考怎么样用深度学习取悦你的女朋友(有代码)),更有趣的是让机器去在已有的绘画风格上进行改变,好的艺术作品,会让人感到恰当好处的偏离传统,即不是对过去一成不变的模仿,也不是完全的颠覆已有的规范,通过将艺术风格提取成高维的数量表征,在对其进行细微的扰动,算法能够产生新的艺术风格,而不只是模仿前人的作品。
在音乐上,最简单的做法是用马尔可夫链,根据之前的音符来预测之后的音符,而用神经网络来做预测,则能够让机器模拟出巴赫的作曲风格,创造出音乐学院的大学生都无法分辨的作品。书中还介绍了根据对已有音乐的特征提取,将音乐所表达的情绪分为8类,从而使的机器做的曲子能够对应特定的情绪。另一个有趣的尝试是算法的生成个性化的古典乐曲,将一段钢琴曲打成几秒钟的碎片,通过随机的组合,生成一段只属于你的钢琴曲,书中作者称之为量子作曲。这方面的商业应用很有前景,广告中,电视剧或者游戏中的背景音,不需要特别好,而且需要很长的时间,相近的风格,完全可以由机器来生成。
在文学创作上,微软小冰已经出版了一本诗集了,IBM的waston很早就赢得Jeopardy的冠军了,但随着作者的描述,我们看到了这些成绩背后的原理,其本质还是搜索与优化。Waston先将问题分类,之后提取关键词以减少搜索范围,之后生成关于答案的200个可能的假设(及其对应的回答),最后根据其从维基百科中的数据对不同假设进行排序。而生成诗歌,只需要遵守诗词的格律,根据前人的诗词作品,用之前的字来预测之后应该是那个字。中文屋的思想实验指出,仅仅能够在行为上模仿人类,不代表真正对语言的理解。
如果当前AI真的理解语言,那waston这些年间就应该可以全面开花,而不必为了某个特定的应用场景专门进行优化和调整。而小冰也应该能够续写冰与火之歌,而不是出版诗集。而当前AI的文字创作,还完全无法写出一个逻辑通顺的故事,用写诗歌的预测喜爱一个词的做法,出来的只是零星的片段,书中介绍的有希望的方式是让机器去问一系列如果这样会发生什么的问题,再自问自答,从而构造出情节张力。目前成熟的,是让AI写不包含感情的公文,例如体育新闻的报道,财务报表的解读,但AI看人下菜碟,创造假新闻的能力,让这个领域蒙上了阴影。但凡涉及到人的喜怒哀乐,哪怕是量产鸡汤文,在完全理解人类意识和情感之前,AI都不可能完成。
而在数学领域,当前的很多证明,都依赖计算机的参与,例如地图只需要四色就能够保证相邻国家的颜色不出现重合,随着证明的越来越长,人们也需要机器来验证证明是否是正确的。书中作者将数学定理的证明和下棋归为了一类,都是按照给定的规则,从一个固定的起点出发,一步步得到最后的结果。这其中的创造性,不是来自与暴力的尝试所有可能的分叉,从而证明出所有可能的定理。而是找出有价值的联系,将俩个看似不同的领域联系起来,例如通过几何的方法,用一张图,来证明连续的奇数之和是一个平方数。
/pic/2_g7gsLqLJmRh9wDlejL83KMu6iaeO6A.jpg
机器不会发挥失常,一旦机器能够达到莫扎特的水平,就会如同莫扎特永生了一样,不停的进行创造。这会不会让人类产生对机器在艺术及创造力上的依赖,就像人类正在变得依赖推荐系统搜索引擎提供的智能外包,异或正由于有无穷的创造力,莫扎特的音乐变的不那么有价值了。人们创造出艺术音乐文学与数学,是为了相互沟通,从而体会做一个他者是什么感觉,从而变得有同理心,进而才有了人类的文明。当我们担心AI带来的反乌托邦时,从AI创造的艺术中,我们可以看到AI是怎么运作的,从而产生有知觉的理解。
更多阅读《Loonshot》读书笔记,涌现视野下的创新
我们为何丢掉了“上游思维”

卢嘉宁2020-08-18 17:57:58

So inspiring…去下单了