铁哥知乎live讲座-从导航看AI的未来

铁哥3月30号要通过知乎live给大家讲解一个有趣的故事。故事的起因,是当下的深度学习日子越来越不好过,自动驾驶,智能对话都在陷入一种人工智能不智能的怪圈, 图像识别被加入的微小噪声糊弄,自然语言处理照猫画虎不理解语言,强化学习海量数据学习条件反射。统统这些问题的背后,是我们没有理解我们自身大脑智能的本质,因此无法把这种智慧运用到AI中。

所以讲座的第一个部分就是对比人工智能和人类智能两大系统寻找两者的区别和联系,再此知道人工智能当下弱在哪。

/pic/1_PrDiaZCQoJICH30fEoXNFXwPSuhTRg.jpg

既然是这样,有些人可能开始觉得幸灾乐祸,看来让机器打败人类的时间尚早,我的工作也一时无法被取代,但是,作为一个人工智能研究者你一定不满意,那么这一段就开始寻找和探讨一些可能的缩小人工智能和生物智能系统差距的方法。不同的学科人士想法其实众说纷纭:

/pic/2_YvxTcYk8LsmUTh7IrLbkeV2zPEzWGA.jpg

此后我们会聚焦在仿生学派(因为我就是这一派),这里的关键是如何理解生物智能到底是怎么来的。然而我要用的是物理学家的方法而不是生物方法。因为大脑是个复杂动力学系统。何为动力学系统,事实上大脑不像电脑 ,拔掉电源就不再工作,仅有输入来有一个输出。而是一个不停演化的动力系统 。最简单的动力学系统是一个单摆系统,有简单的动力学方程确定。那么被牛顿爱因斯坦使用的物理思维和模型就可以用来撸人工智能的羊毛了。

/pic/3_oN79jcR29AOMV96IQhQ7SROGXFfibQ.jpg

讲座的下一部分聚焦在如何研究脑内的动力学,如果用生物学一个个分解研究的思维是很困难的,那么一个很好的方法是以毒攻毒,以复杂攻克复杂,我们使用人工神经网络,来拟合脑,但目的不是拟合,而是找到脑功能动力学的关键。这个机器学习工具是什么呢? 他就是RNN。对RNN的理解可以分为三个层次:机器学习,动力学和图灵机。

/pic/4_XFASkh1E8JicSytpTYLbAI90gD0TaA.jpg

讲座的第三部分就是最精华的部分,铁哥新晋顶会(ICLR)论文为例,说明如何把生物智能的智慧通过RNN得到阐述, 再用来改善我们的人工智能。

这个任务就是导航 。没错,就是解决你在商场总迷路的问题的哪个导航,自动驾驶的关键导航,而且是不依靠GPS的导航。 也许有人立刻想到了自动制图和定位SLAM。但是文章的后面将告诉你地图不是故事的全部,因为作为生物 ,导航有时候需要的其实仅仅是一系列头脑中的行为指令,而不需要任何关于地理位置的概念,简称行为主义的智能法则。

/pic/5_iaLibNok9p18hnd9KCk0JlGq0FfXEg.png

/pic/6_fk2jMTHeHzupickUa2ghnZia72Xiag.png

故事最精彩的地方在于如何告诉你通过一个RNN循环神经网络来把这两种不同的生物的智慧放到一个人工智能系统里,告诉你不仅可以通过智能地图,还可以通过行为流派的方法来完善导航能力。

/pic/7_mPKl2UkJUTaibpbP3Fj0CDiaNDFZLA.png

而且与主流的端到端深度学习不同,文中模拟生物进化和发育的历程,得到如同生物多样性的RNN们,如同不同能力的小鼠,比如最典型的地图鼠,随机鼠,和行为流派鼠(对应刚刚的不同生物智慧)。

/pic/8_DlxvXgXCP29z7eJpibW9rnbTqexeqg.png

为这些不同的“小鼠”我们建立多姿多彩的任务空间,体现我们考虑的是多任务而非单任务学习能力,也更加全面的考察不同小鼠的能力,如同IQ测验。

/pic/9_cVoUHgy4GjB3qXA2TyjX8aBABU4xkA.jpg

最终通过强化学习,我们会得到不同的小鼠对于同样的任务,也喜欢使用不同的策略,而这导致泛化能力千差万别。有的喜欢使用地图,有的擅长用行为流派的方法来做事,虽然它们的动作有时看起来比较机械。有意思的是这些看似机械的行为流派小鼠并非一无是处,在某一类任务上,它们大大优于掌握地图的小鼠。

/pic/10_PU6tic3uDtfhpJJw5wU5XYAXSeJ9Xg.jpg

故事的最终我们将研究这些策略背后的不同神经表示。人工小鼠背后的核心概念RNN及其所依赖的动力系统。而一个更加神秘陌生的概念,RNN的吸引子成为这一部分故事的关键。

故事的最终我们用一个巧妙的方法如何把不同能力的小鼠结合在一起,从而构建一个模块化的超级小鼠,灵活在不同策略直接切换,是真正的全能鼠。

故事的最终我们将展望脑科学和计算神经科学在人工智能方面的更多潜能。

当然这一个小文只是抛砖引玉,要想真正理解文中故事的来龙去脉,3月30,铁哥与你在知乎Live不见不散。

https://www.zhihu.com/lives/1220364052704129024

阅读原文

return clearInterval(siteTime); } var siteTime = setInterval("createTime()", 500); });document.addEventListener('DOMContentLoaded', () => { pangu.autoSpacingPage(); }); })();