分析来自微生物群落的DNA的常见方法,称为微生物组,可能会产生错误的结果,这在很大程度上是由于用于识别微生物DNA序列的数据库不完整。由Sequentia Biotech SL的Aiese Cigliano和Centro de Investigaciones Biologicas Margarita Salas的Clemente Fernandez Arias和Federica Bertoccini领导的团队在8月<>日发表在开放获取期刊PLOS ONE上的一篇论文中报告了这些发现。
近几十年来,微生物组一直是密集研究工作的焦点。这些研究的范围从试图通过检查人体肠道来了解肥胖和自闭症等疾病,到通过研究环境社区来寻找降解有毒化合物或产生生物燃料的微生物。
研究微生物群落的最常用方法依赖于将从生物样本中获得的DNA与基因组数据库中的序列进行比较。因此,研究人员只能识别数据库中已有的DNA序列 - 这一事实可能会以意想不到的方式严重损害微生物组数据的可靠性。
为了测试当前微生物组分析方法的一致性,研究人员使用计算机模拟来创建模仿真实世界细菌种群的虚拟微生物群落。他们使用标准技术来分析虚拟社区,并将结果与原始组合进行比较。实验表明,DNA分析的结果与群落的实际组成几乎没有相似之处,并且分析“检测到”的大量物种实际上并不存在于群落中。
该研究首次证明了目前用于识别微生物群落的技术存在重大缺陷。研究人员得出结论,有必要加大力度从微生物中收集基因组信息,并在公共数据库中提供这些信息,以提高微生物组分析的准确性。与此同时,应谨慎解释微生物组研究的结果,特别是在来自这些环境的可用基因组信息仍然稀缺的情况下。
作者补充说:“这项研究揭示了宏基因组分析的内在限制,这些限制源于当前的数据库局限性以及如何使用基因组信息。为了提高宏基因组数据的可靠性,有必要进行研究工作以改进数据库内容和分析方法。同时,应非常谨慎地处理宏基因组数据。