数据科学是如何帮我们发现心理问题的

心理问题的诊断, 一直都是难度很大的问题, 我们培养专门的心理医生, 但是专业的心理医生永远供不应求。 大量得不到顾及的心理问题, 不仅给个人和家庭带来巨大的损失, 而且给企业和社会带来巨大的负担。

/pic/1_k63mrBgzyXicZibmcnXTfpHwSGhFUA.png图: 大量不得及时诊断的抑郁情况给社会造成巨大损失

心理问题和各种身体问题一样, 尽早发现永远比晚期发现好,但是由于我们往往很难发现自身的心理问题, 而且更很少有人在问题不严重的时候有去看心理医生的习惯。

这时候AI可以帮助我们。 一般你发现不了的东西, 机器往往可以较早的发现insights。随着手机的普及和智能硬件的推广,我们获取各种人类行为和健康的数据越来越多, 比如手环可以全面记录我们的心跳,手机可以记录我们的位置, 我们的运动, 我们的声音,我们社交活动的频率等。

这些数据可能为我们提供各种心理问题的早期检测。

/pic/2_pia0v4b09NqKaMDHEVTIxxkRBvgoEQ.png图: 抑郁引起一系列可观测的行为变化

那么,我就来找几种有趣的心理疾病机器学习诊断方法,以抛砖引玉。 第一个例子谈谈心率测量, 大家知道的最简单的生理测量是心跳吧,通过心跳我们不仅可以指导身体健康状况还可以测量心理压力。

我们看似规律平稳的心跳, 其实包含着众多信息, 这其中重要的就是心跳变化率HRV(heart rate variability), 大家以为心跳是平稳周期性的,其实不然, 如果你精细的看心跳每个时刻到每个时刻的变化, 你会发现这里面在周期之外包含丰富的变化。 HRV通常认为受人类非意识控制神经系统的影响, 因而是一个认识神经系统的通道。 我们在紧张, 放松,工作, 睡眠时候HRV都会有变化。

科学家设计了一组实验, 实验人员让每个被测者(35名IT从业者)带上一个胸带,睡觉时候胸带可以记录被测者在睡觉时候的状态,并连续记录4个月时间, 并回答标准问卷系统以确证心理状态。实验者发现了睡眠时HRV和工作时压力的相关系, 提取长短期的心跳变化率特征和频域特征, 并用一个简单的logistic 模型测量了这个指数。最终测试可以达到59%准确率(低度,中度,高度压力分类任务,如果只分类高压和低压则可达66%,如果在更加可控的人群里, 比如应考压力下的学生,则可达90%) 。

HRV可以反应一个人长期的承受压力指数, 虽然我们的大脑都有自愈能力, 但是长期连续的压力会让这种自愈无法承担, 而造成多钟心理疾病如抑郁症的潜在温床。

/pic/4_ENk8okTVCafdSD0cjjlzU1Q3l2IWog.png图:被测者被要求汇报自己的心情和行为,以和心电检测的结果联系起来

第二种有趣的例子是是社交网络测量抑郁症。什么, 社交网络还能测量抑郁症?首先,一个人在社交网络的行为往往反映其性格, 这已经与神经症的发病率有直接的关系。

第二,一个人所表现的社交网络的行为变化往往体现他在一段时间的状态变化, 自然语言识别可以较有效的发现这些模式。

2013的一篇论文讲述了作者通过twitter预测抑郁症的方法。 这件事的历史最早追溯到2012年Park发现人们有时会把自己接受抑郁症诊断和吃药的信息发到社交网络。 之后13年Choudhury分析了产前和产后妇女社交网络行为的变化, 并根据产前的行为极好的预测了产后的行为, 而这样的结果提示了我们这种方法的可行性。 这篇文章的研究方法是抽取476个用户(一半男一半女,171个具有抑郁症的人和305个不具有抑郁症的人)一年(对于患者是发病1年前的数据)的twitter数据并做特征工程。 我们可以从engagement(参与度,各种发信息的频率和时间),社交网络结构(中心性,双向性,自我趋向度)。

情绪(正,负)和语言风格, 抑郁高频词诊断和预测抑郁症的发生。

一些基本的社交网络特征与抑郁症高度相关, 如下图现实了非抑郁症组(蓝色)和抑郁症组(红色)发状态的密度随一天时间的变化, 明显的看出抑郁症的人更偏向于夜间活跃而正常组白天活跃。

/pic/5_PbYmrzzoFctIFLpMXsOK1OyibdU8bw.png

科学家利用这组数据总结了几种重要特征在一年时间里的辩护, 比如下图从上到下反映了抑郁症患者粽子社交网络的活动数量是递减的, 负面情绪表达的增加, 第一人称表达的增加和第三人称表达的减少,抑郁高频词的增加。

/pic/6_RicayZRxPJJI7ia8nnkkIpSM1YW8uw.png

研究发现抑郁症患者的社交网络有封闭化趋势, 趋向于自我中心,下图描写了用图论和网络中心度来测量抑郁的各项指数, 包括向内, 向外链接的个数, 相互度, 自我中心度等, 最终可以看到抑郁症患者倾向于建立高度自我中心的小网络, 在其中获取情感支持。

/pic/7_OoicZdickmSGewqjZwjyiaqKJ7R6VA.png

最终综合各项指标,社交网络分析可以预测下一段时间抑郁的发病率,正确率高达70%。

/pic/8_bsia4RZGv73AsaCiaicKNwgAChVeVA.png

第三个例子是利用instagram图片库来分析抑郁症的例子。科学家发现, 正常人和患者在instagam上post的照片有显著的色调区别,抑郁症患者明显对图像色调的偏好趋于清冷,灰白,而这种联系之强可以足够一种预测性的方法。

/pic/9_Kia8Cjicoj0WTibsl5WOnwReWz84wg.png

图: 正常和抑郁对不同色调的偏好, 上图为正常,下图为抑郁。

/pic/10_B0NmZLYiarIXuL2aeF5sBULic1DClQ.png图: 科学家可以通过抑郁和非抑郁被测人群喜好使用的图片滤镜判断其类型

第四个例子是利用视线转移来分析自闭症。 同样的图片, 病患和正常人的视线转移是不同的。

第5个例子声音检验, 声音可以帮助我们检验多种心理疾病, 以及心理压力。 最早的通过声音检测压力的实验表情即使在室外手机记录下, 这种检测精度也可以达到76% 之高。声音检测方法几乎可以不通过理解语言本身的含义就知道你大脑的状态, 所以这也是一种比较成熟和稳定的方法。

各种各样的通过数据特征检验心理疾病的方法, 为大数据辅助心理健康的工作奠定了基础。

更多阅读

以色列的数字医疗产业

贝叶斯理论在医学数据分析中的应用

阿尔法狗是怎么用机器学习做决策的

wlz2016-10-02 17:40:36

不管是身体,还是心理方面的问题,大数据应该是最可靠的检测手段,仅靠医生几分钟的望闻听切,是无法准确检查出人体这么一个复杂系统的问题。期盼有更多这方面的应用成果,国庆节还在更新,辛苦了,感谢!

愿意&Run2016-10-02 17:28:22

这篇文章的立意在于增加心理学的可证伪性以及诊断精度,犹如中医有望闻切问四技,某种角度下,望闻问都是下品,唯有切是上品,心理学亦是这样,但是望闻问并不能因此而被丢弃,这里面有一个度的和谐。

Prime_惜独2016-10-04 15:48:00

现代科技的创新下的“医学”最大问题是把人的不同性忽略,只追寻症状的相同性,这本身就无法达到治疗的目的,只能解决症状。

HY2016-10-03 00:29:19

抑郁症患者倾向于建立高度自我中心的小网络, 在其中获取情感支持,一语中的/强