机器学习对话复杂系统特训班之铁哥小结2

巡洋舰特训课总结的下篇, 包括一个更加精彩的部分,就是各位嘉宾的精彩发言,以及各位听众的意见反馈。

精彩嘉宾发言

郑达奇: 自然语言处理小传

自然语言处理研究如何用计算机处理人类语言相关的问题,目前的核心工具即机器学习, 试想日常生活多少场景是要处理语言的, 就知道这领域应用性有多强。各大公司, 包括谷歌, facebook, 百度都有很深布局。想想自然语言处理的应用场景, 你的邮箱是如何归档垃圾邮件的 ? google的自动翻译是如何进行的? 而今日头条又是如何给你推荐文章的? 而一个大新闻出来, 监控部门又是如何知道舆论情绪的变化? 这些都是它的看家本领。

自然语言处理的最简单任务是分析一段话的主观情绪色彩, 如果要你做, 最简单的办法当然是用机器学习提取特征的一般思路, 先提取关键词, 形成一个向量, 然后给每个关键词打上情感标签, 最终生成一个情感向量,并通过分类器得到它的情感。

然而这种情况在一些时候却不一定好用, 比如下图:

/pic/1_NCoTKYia9I20cBdrdX0sfHDevriaNw.png

图: 难以通过抓关键词打标签判断真实表达的意思

哦, 语境很重要 ! 这个时候更复杂的语言模型就派上用场, 那么如此复杂的语言如何通过一个模型表示呢? 这就是深度学习可以进入的领域了, 因为深度学习可以挖掘语言中的更深层特征, 无需停留在浅层的打标签上。

深度学习在自然语言处理中的应用最大的表现就是依靠循环神经网络(RNN)对语言进行建模。我们可以利用梯度下降的方法对RNN进行训练,此法最大的好处在于可以对不定长的语句建模,在此基础上我们发展出各种fancy的语言建模机器,以及比以往方法好很多的结果。RNN具有记忆性能,而它的改进版, LSTM,GRU则更好, 可以非常好的结合语境信息来对语义进行判断,因此在情感分析, 机器翻译, 自动问答中都有良好应用。

/pic/2_HAJ93jMkMaktczeNtUuLSu0rlfkFxw.png
图: 深度学习模型循环神经网络RNN处理文本示意图, x即输入信息(文本序列), o是输出信息(依然是一个序列), s是神经网络的状态(可以记录历史信息)。

孤胆鹰雄芯 :人工智能与生物智能- 关于三种造物

人工智能可以和生物智能做一个很好的类比, 那就是丹内特关于三种造物的说法:

在《达尔文的危险观念》(Darwin’s Dangerous Idea)第13章第1节(该节后来重用于《心灵种种》(Kinds of Minds)第4章)里,丹内特将意识和意向性立场的进化过程分为如下四个阶段:

1)达尔文式造物(Darwinian creatures):行为模式是“硬连线”的,试错只能通过代际变异和自然选择进行 。 此处对应进化选择算法, 生物的行为模式无法在同一代上进行学习和变换。

2)斯金纳式造物(Skinnerian creatures):具有表现型灵活性,在个体生活史中能够试错学习。得名自行为主义心理学家斯金纳(B. F. Skinner);此处的学习是条件反射式的, 你在某种条件下做出某种行为, 根据反应的结果来肯定或否定某个行为。 比如你看到一只狗, 你去摸它然后被狗咬了, 之后见到狗你就不摸,而是逃跑。此处的学习类型对比某种浅度的机器学习, 例如简单的线性分类器。

3)波普式造物(Popperian creatures):能够对外部世界进行表征,形成认知、信念和预期,预先在若干选项中做出挑选。得名自哲学家卡尔•波普(Karl Popper);此处还延续上面的例子, 你看到一只狼, 或者哈巴狗,你从来没见过它们, 你依然可以由之前对于狗的经验, 对其行为做预测, 此处指具有类推和泛化能力的学习模式。对应于机器学习里的深度学习, 可以通过自主挖掘事物的特征学习新的类别。

4)格列高利式造物(Gregorian creatures):得益于语言和文化传播,能从其他生物那里获取既经测试的知识和经验;人类的独特性在于他们是唯一的格列高利式造物。得名自心理学家理查德•格列高利(Richard Gregory)。格里高利造物对应于群体学习能力, 此处生物体通过语言沟通交换经验进行学习, 而不是需要一一试错, 比如被狗咬了才知道此非善类。 对应于人类通过书籍和与人交流学习的模式。 格里高利造物依然没有被今天的机器学习达到。

孤胆同学还介绍了如何应用深度学习在光学影像处理中, 想知道细节的可以找铁哥索要他微信。

于海跃:如何用随机森林检测癌症

机器学习早已在图像检测和识别中发挥重要作用,尤其是医疗图像检测。 海悦博士讲解了随机森林算法在癌症图像检测中的应用。 随机森林可以有效的对正常细胞和病理细胞进行分类, 在我们不知道哪些特征是最重要的分类指标和样本数有限的情况下,这种方法特别有效。

于松民Agent Base Model 做碳交易市场的预测

Agent base model是一种研究复杂系统的常用方法, 我们首先已知每个Agent(单元)的行为策略以及单元之间的联系,然后让这种行为策略向不同方向变化观察对系统产生的影响。Agent base model可以指导我们在碳交易市场如何定价达到节能减排而最小影响经济效益的问题。 其中又用到进化选择算法。 这个模型在理解经济,金融市场的交易行为和博弈中具有重大意义。

赵名康 : 股市交易策略

股市的价格是由什么决定的? 人和市场的关系是什么? 散户在股市交易中的有效策略是什么?

赵老师提出了一个框架指导人认识股市价格的成因和操作技巧, 讲到股价主要受到企业状况,市场因素,情绪因素的影响, 这些因素都使得我们很难通过基本面分析预测股市。 虽然不能预测股价,我们依然可以通过过程控制来操作股票,其中的道理与贝叶斯分析是想通的, 即我们先要做出假设,然后通过一定的信号验证假设,再进行相应操作,而操作得到的结果又反馈回来指导我们继续调整操作。这个思想对于机器学习做股市很有启发性。

各位专家的讲演都十分惊艳,此处只能呈现冰山一角,以下是同学感言**:**

傅昊 :

回味以上内容和各位大神的分享,总结成一句话是:16小时,在铁哥和诸神的引领下,我们乘坐混沌巡洋舰号,鸟瞰了由机器学习和复杂系统为径度,跨越数学、物理、计算机、医学、经济、金融各领域为纬度的若干壮丽风景。

傅昊结合周末两天学习内容,和最近的感触,第二遍总结如下,与铁哥和亲们分享:

一个人有没有梦想是个问题:例如,我想去月球。这是个梦想。
这个人有了梦想如何实现又是一个问题:为了实现这个梦想,需要选择和应用适合的方法:
小学生给出的方法:造一个梯子,然后爬上月亮;
大学生给出的方法:造一支火箭,然后飞上月亮;

里面最大的坑,不在于选定方法后的努力,而在于我能否认知和应用正确的方法并努力实践。

花大量时间、精力学习,意义在于以目标驱动(focus on right objective),找到或者创造正确的方法,并实现之 (just approach it with right method/tool)。

如果有缘,与 right person 合作,可以加速实现共同的梦想。

至于缘分,需要符合两点:1. 让更多 right person 了解你;2. 成为你心仪的 right person 喜爱的人。

再次感谢铁哥,常易,左晨泽,郑达奇,于海跃,于松民,赵名康各位讲者的精彩分享,傅昊能做的是:1. 希望有机会和大家分享更多;2. 在一个目标上找到正确的方法并努力实践直到实现这个目标,以回馈大家更多。

还期望待,有一天我们聚众 review alphaGo 代码 or 我们创造 bateCome。

副部长 :
知识不能被发明,只能发现。混沌巡洋舰是时空飞船,带大家遨游。每个游客都有自己的一些了解,船长是导游,带团跟大家讲解,讲游客自己拍照游览不能发现的时空角度。
就是,报团,一起玩。

在时间纬度上,随着时间向前,高级知识会越来越多的普及到更多的人,可能是由于物理的身体越来越得到物质的保障,大脑这个认知单元的能力本能需要得到满足,甚至认知有贪婪的倾向,或者是越认知越有不安全感。
就是玩的投入,不能自拔。

第一次乘舰,跟大家组团游混沌世界。新鲜,新奇,也紧张。
就是,挺好玩,没全懂。

具体点的建议是,是否对参加的人,做了一些了解,信息分析,针对其具体的背景,举个应用的(或者科幻前卫的)案例。尤其是所谓传统行业的背景。跨界产生裂变。

我真切的感受到大家的热情真诚,求知若渴。
传播知识,升级认知,善莫大矣。感谢舰长,舰副,舰员。。。
下次,约起。

此致,敬礼!

马伟 :

马伟笔记部分简要: 神经网络没有时间轴,过滤。梯度回传。递归神经网络。神经图灵机,通用智能。可微分。正态分布,肥尾分布。交易率聚集。理论假设不一致,信息接收不一致,预期不一致。均衡假设。agent based model.基准价值。偏好加理性。A=f(E.AP)基于收益参数的迭代。刻画belif假设或函数。过滤器。无意识有意识学习,强化学习。有意识学习,路径学习。分滤器刻画LERNING。只考虑自己的学习,周围人的学习。遗传算法。交叉,突变。价格形成机制的模型。优化。肥尾分布参数。于松民。哲学系统。资金控制模式,信息诱导,观察追随。客观、符号、主观。会计系统是符号系统。投资者的认知。实体研究,市场实验。边际资金是0,或1。尖顶,平顶。震荡因无法预测没办法赚钱。决策流程:假设,检验,修正。证伪。不是正面的证据而是负面的反馈。接近规律而不能预测规律。幸运扩张的大背景下。连续而不是离散。中级趋势,信号得到闭环。观察检验。市场非鲜艳的,过程管理。检验测试。立体交易。交易逻辑。宏观特征微观信号。大头压在相对确定的趋势上。留的时间长让市场验证你的判断是对的。唯一认知不可行。集小胜为大胜。敢赢,把最大的筹码压在确定性的趋势上。集体智慧决策能力。如何干预复杂系统。

O_o :
通过这次特训班,让我对机器学习和复杂系统有了一个整体上的把握,同时对贝叶斯有了更深刻的认识,当然更重要的是见到了很多大神和认识了很多朋友,希望铁哥组织更多这样的学习机会,当然如果能够在上海组织下就更好了[呲牙]。还有就是铁哥可以组织大家一起线下学习,制定详细而又灵活的线下学习计划,同时定期线上反馈和交流,初期可以通过阅读经典书籍打下基础,后期可以跟踪阅读最新发表文献把握最新进展。

朱雀高

通过这次特训,对机器学习和复杂科学有了一个大概的了解,但是还想继续深入了解机器学习的具体应用和实现,希望可以再开一些这样的特训课,应该会很受欢迎的。最后还是要感谢一下铁哥,混沌巡洋舰一定会成功的!

Homme

经过了两天的特训,对机器学习和复杂系统有了更全面的了解,不仅是铁哥的讲解,各行各业的精英们的分享,也让我眼前一亮,虽然并不是每一步推导,每一个知识点都能听得懂,但我还是愿意去学习这门蕴含着奥秘十分有趣的学科。

另外,如果以后还组织类似的特训班,我想提一些建议:1.希望能够发放讲义,讲义不必太详细,留下一点做笔记的空间,这样更方便自己的笔记与知识点的对应,同时也减少了一些笔记量,不会因为过于注重记录而错过重要的知识点。2.希望能找一个有桌子的教室,放本子水杯之类的杂物更加方便,记笔记也不用垫在腿上。

还是感谢铁哥两天来精彩的讲授,辛苦了铁哥。感谢铁哥提供这个平台让我见到了许多优秀的人,向你们学习,一起努力

* * * * * * * 小插曲,大家可以集思广益哦

副部长
想做个婚恋匹配模型,就是把男女的信息输入,马上给出婚姻预测。[呲牙]大家帮忙想有啥建议。

三藏爱你
[色],我认为性格、消费观和家庭背景最关键,请加大门当户对的影响比重。

马伟
@副部长~齐洪军 回头我给你想想[坏笑]

欢迎关注巡洋舰机器学习后续活动!