在单细胞水平上分析数据的最新进展帮助生物学家在发现有关细胞及其行为的新信息方面取得了长足的进步。一种常用的方法,称为聚类,允许科学家根据特征对细胞进行分组,例如活性或非活性基因的独特模式,或者通过复制细胞的后代(称为克隆)对细胞进行分组。
尽管单细胞聚类已经导致了许多重要的发现,例如,新的癌细胞亚群或未成熟干细胞成熟为“特化”细胞的方式,但到目前为止,研究人员还无法将他们对基因激活模式的了解与他们所知道的克隆谱系结合起来。
现在,由宾夕法尼亚大学生物工程教授Arjun Raj领导的Cell Genomics上发表的研究导致了ClonoCluster的开发,这是一种开源工具,将独特的基因激活模式与克隆信息相结合。这会产生混合聚类数据,可以快速识别新的细胞性状;然后可以用来更好地了解对某些癌症疗法的耐药性。
“以前,这些是独立的模式,你会将表达相同基因的细胞聚集在一个批次中,并将其他具有共同祖先的细胞聚集在另一个批次中,”第一论文作者,Raj实验室的前博士后Lee Richman说,他现在在波士顿的布莱根妇女医院。“令人兴奋的是,这个工具允许你在簇周围画新的线并探索它们的特性,这可以帮助我们识别新的细胞类型、功能和分子途径。
Raj实验室的研究人员使用一种称为条形码的技术为他们感兴趣的研究细胞分配标签,这对于跟踪细胞,根据细胞后代对数据进行聚类以及随时间跟踪谱系特别有用。研究人员相信他们可以通过结合细胞独特的基因激活模式从这些数据中解析出更有价值的信息,因此将ClonoCluster应用于六个实验数据集,这些数据集使用条形码来跟踪分裂细胞的后代。具体来说,他们研究了化疗耐药性和干细胞发展成专门的组织类型。
就像立体声系统允许用户控制左扬声器相对于右扬声器之间的声音平衡一样,研究人员在ClonoCluster中添加了一个名为“alpha”的可调参数。这使得团队能够微调他们对克隆条形码聚类相对于基因激活模式的重视程度 - 0对应于基因激活模式,1对应于克隆条形码。在这个0到1的alpha量表上,他们发现alpha设置得越接近克隆通道,它们的杂交簇就越能表达与细胞外环境相互作用和信使RNA蛋白质翻译相关的独特基因水平。
“通常,当你考虑细胞功能是如何决定和调节的时,你认为很可能是内在机制决定了哪些基因将被表达,或者细胞的命运,”里奇曼说。“因此,我们认为这暗示了这样一个事实,即细胞也可以通过非遗传手段继承性状,可能通过环境线索。
基因调控背后的普遍观点表明,被称为转录因子的蛋白质与DNA序列上的特定点结合并激活或抑制某些基因,这有助于解释为什么动物中的大多数细胞具有相同的遗传信息,但发挥不同的作用。当这些细胞与不同的位点结合时,转录因子向蛋白质制造装置发出信号,细胞应该产生哪些蛋白质以保持功能相关性。然后,科学家可以使用这些生物标志物来监测细胞特性,并预测细胞下一步可能做什么。
加强对细胞行为和分化的科学理解可以改善对细胞克隆的了解。它还可以提供关于重复猖獗时出错的见解,例如在癌症和与基因突变相关的某些疾病的情况下,这些疾病的特点是克隆细胞在给定细胞群中的过度代表性。
为了进一步推进这项工作,研究人员开发了一种ClonoCluster的补充工具,他们称之为Warp Factor。这结合了现有的机器学习工具,该工具简化了数据集可视化,以更好地解释克隆数据与其混合集群之间的关系。使用这两种工具,研究小组确定了以前似乎过于分散而无法推断细胞身份的不同表达模式,这些信息可以帮助研究人员更多地了解细胞如何分化和功能。
“我们认为这项工作表明,随着时间的推移跟踪细胞身份可以提供研究人员尚未意识到的新信息层,并希望可以用来加深我们对癌症和其他疾病的理解,”Raj说。
他和同事们将继续更新和完善克隆集群。他们认为这是计算细胞生物学领域的重大进步,有可能在未来提供更完整的细胞特征和功能。