跳动百科

研究敦促在将神经网络与大脑进行比较时要谨慎

瞿咏韵
导读 似乎产生类似大脑活动的计算系统可能是研究人员引导它们获得特定结果的结果。神经网络是一种松散地模仿人脑组织的计算系统,构成了许多人工

似乎产生类似大脑活动的计算系统可能是研究人员引导它们获得特定结果的结果。

神经网络是一种松散地模仿人脑组织的计算系统,构成了许多人工智能系统的基础,用于语音识别、计算机视觉和医学图像分析等应用。

在神经科学领域,研究人员经常使用神经网络来模拟大脑执行的相同类型的任务,希望这些模型可以提出关于大脑本身如何执行这些任务的新假设。然而,麻省理工学院的一组研究人员敦促在解释这些模型时应更加谨慎。

在对超过11,000个神经网络的分析中,这些神经网络被训练来模拟网格细胞的功能 - 大脑导航系统的关键组成部分 - 研究人员发现,神经网络只有在被赋予非常具体的约束时才会产生类似网格细胞的活动在生物系统中没有。

“这表明,为了获得网格细胞的结果,研究人员训练了所需的模型,以特定的,生物学上不可信的实施选择来烘焙这些结果,”麻省理工学院前高级研究员Rylan Schaeffer说。

如果没有这些限制,麻省理工学院的研究小组发现很少有神经网络产生类似网格细胞的活动,这表明这些模型不一定能对大脑的工作方式产生有用的预测。

斯坦福大学计算机科学研究生Schaeffer是这项新研究的主要作者,该研究将于本月在2022年神经信息处理系统会议上发表。Ila Fiete是大脑和认知科学教授,也是麻省理工学院麦戈文脑研究所的成员,是该论文的资深作者。麻省理工学院物理学研究生Mikail Khona也是一名作家。

网格单元建模

几十年来,研究人员一直在使用神经网络来执行各种计算任务,它由数千或数百万个相互连接的处理单元组成。每个节点与网络中的其他节点都有不同强度的连接。当网络分析大量数据时,随着网络学习执行所需任务,这些连接的强度会发生变化。

在这项研究中,研究人员专注于神经网络,这些神经网络已被开发用于模仿大脑网格细胞的功能,这些网格细胞存在于哺乳动物大脑的内嗅皮层中。网格细胞与海马体中发现的位置细胞一起形成一个大脑回路,帮助动物知道它们在哪里以及如何导航到不同的位置。

位置细胞已被证明会在动物处于特定位置时触发,并且每个位置细胞可能会对多个位置做出反应。另一方面,网格单元的工作方式非常不同。当动物在房间等空间中移动时,网格单元仅在动物位于三角形格子的顶点之一时触发。不同的网格单元组创建尺寸略有不同的晶格,这些晶格相互重叠。这允许网格单元使用相对较少数量的单元格对大量唯一位置进行编码。

这种类型的位置编码还可以根据给定的起点和速度预测动物的下一个位置。在最近的几项研究中,研究人员训练神经网络来执行相同的任务,这被称为路径集成。

为了训练神经网络来执行这项任务,研究人员向它输入了一个起点和一个随时间变化的速度。该模型基本上模仿了在空间中漫游的动物的活动,并在移动时计算更新的位置。当模型执行任务时,可以测量网络中不同单元的活动模式。每个单元的活动可以表示为一种放电模式,类似于大脑中神经元的放电模式。

在之前的几项研究中,研究人员报告说,他们的模型产生的单元具有与网格细胞的放电模式非常相似的活动模式。这些研究得出的结论是,网格细胞状表示自然会出现在任何训练执行路径积分任务的神经网络中。

然而,麻省理工学院的研究人员发现了非常不同的结果。在对他们训练的11,000多个路径集成神经网络的分析中,他们发现,虽然其中近90%的人成功地学会了这项任务,但这些网络中只有约10%产生了可以归类为网格细胞的活动模式。这包括即使只有一个单元获得高网格分数的网络。

根据麻省理工学院的研究小组的说法,早期的研究更有可能产生类似网格细胞的活动,只是因为研究人员在这些模型中建立了限制。

“早期的研究已经提出了这样一个故事,如果你训练网络进行路径整合,你会得到网格单元。我们发现,相反,你必须做出一长串参数选择,我们知道这与生物学不一致,然后在这些参数的一小部分中,你会得到想要的结果,“Schaeffer说。

更多生物模型

在早期研究中发现的约束之一是,研究人员要求模型将速度转换为一个独特的位置,由一个对应于位置单元的网络单元报告。为此,研究人员还要求每个位置细胞仅对应一个位置,这不是生物位置细胞的工作方式:研究表明,海马体中的位置细胞可以响应多达20个不同的位置,而不仅仅是一个位置。

当麻省理工学院的研究小组调整模型,使位置细胞更像生物位置细胞时,模型仍然能够执行路径整合任务,但它们不再产生类似网格细胞的活动。当研究人员指示模型生成不同类型的位置输出时,网格细胞状活动也消失了,例如在具有X和Y轴的网格上的位置,或者位置作为相对于原点的距离和角度。

“如果你要求这个网络做的唯一事情是路径积分,并且你对读出单元施加一组非常具体的,而不是生理的要求,那么就有可能获得网格细胞,”Fiete说。“但是,如果你放松这个读出单元的任何这些方面,就会大大降低网络产生网格单元的能力。事实上,通常他们不会,即使他们仍然解决路径集成任务。

因此,如果研究人员还没有知道网格细胞的存在,并指导模型产生它们,那么它们不太可能作为模型训练的自然结果出现。

研究人员说,他们的研究结果表明,在解释大脑的神经网络模型时需要更加谨慎。

“当你使用深度学习模型时,它们可以成为一个强大的工具,但人们必须非常谨慎地解释它们,并确定它们是否真的在做出从头预测,甚至揭示大脑正在优化的内容,”Fiete说。

伦敦大学学院(University College London)定量神经科学教授肯尼斯·哈里斯(Kenneth Harris)表示,他希望这项新研究能够鼓励神经科学家在陈述神经网络和大脑之间的类比可以显示的内容时更加谨慎。

“神经网络可以成为预测的有用来源。如果你想了解大脑如何解决计算问题,你可以训练一个网络来执行它,然后测试大脑以同样的方式工作的假设。无论假设是否得到证实,你都会学到一些东西,“哈里斯说,他没有参与这项研究。“这篇论文表明,'后听'的力量较小:神经网络有许多参数,因此让它们复制现有结果并不那么令人惊讶。

麻省理工学院的研究人员说,当使用这些模型来预测大脑如何工作时,在构建模型时考虑现实的、已知的生物学限制是很重要的。他们现在正在研究网格细胞的模型,他们希望能够更准确地预测大脑中的网格细胞是如何工作的。

“深度学习模型将让我们了解大脑,但只有在你向模型中注入大量生物学知识之后,”Khona说。“如果你使用正确的约束,那么模型可以给你一个类似大脑的解决方案。