机器学习算法在神经科学领域的应用

机器学习算法在神经科学领域的应用

源 | 头条文章    文 | 葱葱茫茫导

“人工智能”,“机器学习”,“深度学习”是时下最热门的话题,而人工神经网络(Artificial Neural Network, ANN)无疑又是其中最为人所津津乐道的算法。ANN概念的起源受到了神经科学的启发,它模拟了大脑神经元对于信息的处理和传播:数以亿计的神经元之间互相协作构成网络结构,通过各层级神经元的处理,输出整个神经系统的信号(这个假想的模型是否真实地反映了大脑的运作模式,科学界仍然争议不断)。

ANN可以看作是神经科学对机器学习的启迪,而本篇文章则是将最基础的机器学习算法:主元成分分析(Principal Component Analysis, PCA)与线性判别分析(Linear Discriminant Analysis)运用于神经科学,帮助解码神经元在工作记忆时活动模式。

所谓的工作记忆(working memory),即为带着记忆进行工作“working with memory”,指得是一种持续地保持并且操控信息并且将之用于指导即将发生的响应的能力(the ability to transiently maintain and manipulate information used to guide a forthcoming response)。这个过程有点像你在逛商场时,心算着一件打折的大衣可以省下多少钱,从这个内心持续盘算着的过程就是工作记忆,它可以指导你的买或者不买的行为。

Christopher C. Lapish课题组在2017年9月发表于Cerebral Cortex上的文章选用了研究工作记忆的最经典的行为学实验:延迟期的空间得到-转移任务(Delayed Special Win-Shift task, DSWS)。该任务基于一个八臂迷宫,迷宫臂的尽头都有一份美食奖赏(巧克力牛奶)。

任务分为三个阶段:

一. 训练期(training phase),随机选择四个臂关闭入口闸门,大鼠被置放于迷宫中心,允许自由地探索环境,允许获取四个闸门开启的臂中的食物;

二. 延迟期(delay phase),一旦大鼠完全取得了四个开放臂中的食物,则它所在的的臂闸门自动关闭。大鼠的被局限于迷宫一臂,灯光熄灭,给大鼠60-90s的时间思考之前的经历与计划未来的行动,因此延迟期的过程既有回顾性策略(retrospective strategy)又有前瞻性策略(prospective strategy)。延迟期也被认为是工作记忆工作的最相关时期;

三. 测试期(test phase),在延迟期结束后,所有迷宫臂的闸门都打开,大鼠被允许自由的探索和获取食物,但是只有之前闸门关闭的迷宫臂尽头仍然有美食。

研究人员在大鼠的前额叶皮层植入24根独立的电极,在海马区植入1根独立的电极。手术恢复期后,让大鼠在进行DSWS任务,同时记录前额叶皮层与海马区的电生理信号(包括局部场电位Local Field Potential, LFP与单个神经元活动single-unit activity)。

大鼠的每一次行为学试验(trial)被分类为表现良好(good performan)和表现不佳(bad performance),分类标准为如果一次试验超过三次错误(错误定义为:大鼠错误地再次走进了之前去过的迷宫臂或者测试期时间过长>5min都没有取得全部食物)该次试验及被定义为表现不佳,并且认为表现良好来源于更有效率更良好的工作记忆。在5只大鼠共计48次行为试验中,27次试验定义为表现良好,21次试验定义为表现不佳。

该课题组发现在整个行为任务过程中,大鼠的前额叶皮层mPFC和海马HC的theta波段(4-12Hz)振荡信号功率明显提高,认为是mPFC与HC的认知功能的表达。并且该两个脑区的LFP信号也体现出高度的一致性(coherence),一致频率段集中于8Hz左右,反映出mPFC和HC脑区间大量信息的交换。

机器学习算法在神经科学领域的应用

研究人员将研究重点聚焦于与工作记忆相关的延迟期(共计60s),发现在表现良好的试验数据中,mPFC和HC的theta波段震荡功率与一致性在延迟后期(延迟期后30s)有更明显的提升,同时发现在mPFC的分离出的单个神经元活动更多地在延迟后期与HC的LFP信号锁相位(phase-locking),这些现象在表现不佳的试验中并没有体现,揭示了在工作记忆发生时两个脑区在前期与后期不同的电生理活动模式。

机器学习算法在神经科学领域的应用

机器学习算法在神经科学领域的应用

为了识别mPFC神经元的电生理活动模式,该研究应用主元成分分析(Principal Component Analysis, PCA)对分离出的710个mPFC的神经元放电信号(需要分析的每段数据总长100s,每个time bin为1ms,所以每个神经元放点信号数据的维度为100万)的模式进行降维处理,在尽量减少信息丢失的基础上去除相关的维度,保留信号的最主要的两个特征(PC1和PC2),这样100万维度的数据经过基变换,被投影在2维的正交向量上,数据的维度也被降到了2,方便人们轻易地看出数据主要特征的规律。

研究人员发现为PC1特征提供主要信息的神经元(特征最大相关的前1/3数量的神经元,n=256)的放电模式主要在训练期增加点火率(firing rate),在延迟期减少点火率;而为PC2特征提供主要信息的神经元(特征最大相关的前1/3数量的神经元,n=256)的放电模式则是在延迟期大幅提高点火率并且在测试期维持仍然维持高点火率,并且在表现良好试验数据中有更高的鲁棒性。反向追溯mPFC该组神经元的活动与HC的LFP信号锁相位,发现在表现良好试验数据中,拥有更多PC2特征的神经元活动会更多地和HC的LFP信号锁相位。通过对检测到的所有mPFC的神经元放电模式的识别,揭示拥有更多PC2特征神经元是工作记忆相关的神经元。

机器学习算法在神经科学领域的应用

为了解码工作记忆时mPFC神经元的放电活动策略,研究人员利用3877个训练期与3877个测试期的神经元放电活动数据作为训练数据集(training set),用线性判别分析(Linear Discriminant Analysis)算法做有监督学习训练分类器(2类:训练类与测试类)。 

如果预测数据的放电模式被分类器归为训练类,则认为预测数据的放电模式更接近于训练期的神经元放电模式,采用回顾性策略,在认知层面上更倾向于回忆与分析过往经验与信息进行推理;如果预测数据的放电模式被分类器归为测试类,则认为预测数据的放电模式更接近于测试期的神经元放电模式,采用前瞻性策略,在认知层面上更倾向于利用任务规则进行未来行为的计划。

之后研究人员将训练成功的分类器用于预测延迟期的数据,发现在延迟前期,数据放电模式在训练类和测试类上并无偏好,揭示在工作记忆前期,回顾性和前瞻性策略并存。在延迟后期,数据放电模式更接近于测试类,揭示在工作记忆后期,前瞻性策略逐渐占了主导。而这些发现仅存在于表现良好(有效的工作记忆)的试验中。

机器学习算法在神经科学领域的应用

该研究利用了机器学习的算法,揭示了在工作记忆发生时,大鼠的前额叶皮层与海马区的神经元在电生理活动层面上的动态模式转换,是一个非常好的机器学习在神经科学中的应用例子。

原文链接

http://academic.oup.com/cercor/article-lookup/doi/10.1093/cercor/bhx184

参考文献

  • Baddeley, A. D. Working memory.  (Clarendon Press ; Oxford University Press, 1986).

  • Myroshnychenko, M., Seamans, J. K., Phillips, A. G. & Lapish, C. C. Temporal Dynamics of             Hippocampal and Medial Prefrontal Cortex Interactions During the Delay Period of a Working         Memory-Guided Foraging Task. Cereb Cortex27, 5331-5342, (2017).

  • 作者:Cong Wang

    机器学习算法在神经科学领域的应用

    澳大利亚昆士兰脑科学研究所神经科学方向在读PhD,本科硕士毕业于复旦大学电子工程系生物医学工程专业。主要研究方向为大脑的记忆与学习,大脑恐惧情感环路,脑电信号分析,神经元的编码与解码。微博:葱葱茫茫导

    声明:本文首发于作者头条文章(点击阅读原文可访问),小象经作者授权获得微信公众号首发权。

    机器学习算法在神经科学领域的应用