跳动百科

机器学习方法提高了对细胞身份的理解

胥玲德
导读 当基因被激活和表达时,它们在细胞中显示出在组织和器官中类型和功能相似的模式。发现这些模式可以提高我们对细胞的理解,这对揭示疾病机制

当基因被激活和表达时,它们在细胞中显示出在组织和器官中类型和功能相似的模式。发现这些模式可以提高我们对细胞的理解,这对揭示疾病机制具有重要意义。

空间转录组学技术的出现使研究人员能够在整个组织样本的空间环境中观察基因表达。但是需要新的计算方法来理解这些数据,并帮助识别和理解这些基因表达模式。

由卡内基梅隆大学计算机科学学院计算生物学Ray和Stephanie Lane教授Jian Ma领导的研究小组开发了一种机器学习工具来填补这一空白。他们关于这种方法的论文名为SPICEMIX,作为封面故事出现在最新一期的Nature Genetics上。

SPICEMIX帮助研究人员理清不同的空间模式在大脑等复杂组织中细胞的整体基因表达中所起的作用。它通过用空间元基因表示每种模式来实现这一点 - 可能与特定生物过程相关的基因组,并且可以在组织中显示平滑或零星的模式。

该团队包括马云;本杰明·奇德斯特(Benjamin Chidester),计算生物学系的项目科学家;博士生Tianming Zhou和Shahul Alam使用SPICEMIX分析小鼠和人类大脑区域的空间转录组学数据。他们利用SPICEMIX的独特功能来揭示大脑细胞类型和空间模式的景观。

“当我们选择这个名字时,我们的灵感来自烹饪,”Chidester说。“你可以用同一套香料制作各种不同的口味。细胞可能以类似的方式工作。他们可能使用一组共同的生物过程,但他们使用的特定组合赋予了他们独特的身份。

当应用于脑组织时,SPICEMIX比其他方法更准确地识别大脑中细胞类型的空间模式。它还通过学习的空间宏基因揭示了脑细胞类型的新表达模式。

“这些发现可能有助于我们更全面地描绘脑细胞类型的复杂性,”周说。

使用空间转录组学技术的研究数量正在迅速增长,SPICEMIX可以帮助研究人员充分利用这些大容量、高维数据。

“我们的方法有可能推进空间转录组学研究,并有助于更深入地了解复杂组织中的基础生物学和疾病进展,”Ma说。