跳动百科

新的人类泛基因组参考文献发布

连妹全
导读 更完整和复杂的基因组序列集合 - 泛基因组 - 捕获了更多的人类多样性。研究人员发布了一个新的高质量参考人类基因组序列集合,该序列从

更完整和复杂的基因组序列集合 - 泛基因组 - 捕获了更多的人类多样性。

研究人员发布了一个新的高质量参考人类基因组序列集合,该序列从不同人群中捕获的多样性比以前多得多。

这项工作由国际人类泛基因组参考联盟领导,该联盟由美国国立卫生研究院下属的国家人类基因组研究所(NHGRI)资助。

新的“泛基因组”参考包括47人的基因组序列,研究人员的目标是到350年中期将这一数字增加到2024人。由于每个人都携带一组成对的染色体,目前的参考包括94个不同的基因组序列,通过完成该项目达到700个不同的基因组序列。

这项工作发表在《自然》杂志上,是联盟成员发表的几篇论文之一。

基因组是帮助每个生物发育和功能的一组DNA指令。个体之间的基因组序列略有不同。就人类而言,任何两个人的基因组平均而言,99%以上是相同的。微小的差异有助于每个人的独特性,并可以提供有关其健康状况的见解,帮助诊断疾病,预测结果并指导医学治疗。

为了理解这些基因组差异,科学家们创建了参考人类基因组序列作为“标准”——人类基因组序列的数字合并,可以用作对齐、组装和研究其他人类基因组序列的比较。

原始参考人类基因组序列已有近20年的历史,随着技术的进步和研究人员修复错误并发现人类基因组的更多区域,该序列已定期更新。然而,它在代表人类物种多样性方面受到根本限制,因为它仅由大约20人的基因组组成,并且大多数参考序列仅来自一个人。

“每个人都有独特的基因组,因此对每个人使用单一的参考基因组序列会导致基因组分析的不平等,”NHGRI校内研究计划计算和统计基因组学处的高级研究员Adam Phillippy博士说。“例如,预测遗传疾病对于基因组与参考基因组更不同的人可能不起作用。

目前的参考人类基因组序列存在反映缺失信息的差距,特别是在重复和难以阅读的区域。最近的技术进步,如长读长DNA测序,一次读取更长的DNA片段,帮助研究人员填补了这些空白,创建了第一个完整的人类基因组序列。这个完整的人类基因组序列于去年作为NIH资助的端粒到端粒(T2T)联盟的一部分发布,已被纳入当前的泛基因组参考。事实上,许多T2T研究人员也是人类泛基因组参考联盟的成员。

使用先进的计算技术来对齐各种基因组序列,研究人员构建了一个新的人类泛基因组参考,泛基因组中的每个组装覆盖了预期序列的99%以上,准确率超过99%。它还建立在先前的参考基因组序列之上,在DNA中添加了超过100亿个新碱基或“字母”。虽然以前的参考基因组序列是单一和线性的,但新的泛基因组同时代表了人类基因组序列的许多不同版本。这为研究人员提供了更广泛的选择,可以使用泛基因组来分析其他人类基因组序列。

“通过使用泛基因组参考,我们可以更准确地识别称为结构变异的更大的基因组变异,”加州大学圣克鲁斯分校博士生,该论文的共同第一作者Mobin Asri说。“我们可以找到以前使用依赖于线性参考序列的方法未识别的变体。

结构变体可能涉及数千个碱基。到目前为止,由于使用单个参考序列的偏见,研究人员一直无法使用短读长测序来识别每个人类基因组中的大多数结构变异。

“人类泛基因组参考将使我们能够在以前无法进入的基因组区域中代表数以万计的新型基因组变异,”耶鲁大学博士生,该论文的共同第一作者Wen-Wei Liao说。“有了泛基因组参考,我们可以通过提高对基因和疾病特征之间联系的理解来加速临床研究。

支持人类泛基因组参考联盟工作的总成本预计将在五年内约为40万美元,其中包括努力创建人类泛基因组参考,改进DNA测序技术,运营协调中心,开展外展活动并为研究界创造资源使用泛基因组参考。

许多基因组被测序以构建新的人类泛基因组参考的个体最初是作为1个基因组计划的一部分招募的,这是一项合作和国际努力,部分由NIH资助,旨在改善不同人群的基因组变异目录。由于人类泛基因组参考是一项正在进行的工作,来自国际人类泛基因组参考联盟的研究人员继续添加更多的基因组序列,以提高泛基因组参考的质量。

“使用基因组学的基础研究人员和临床医生需要获得反映人口显着多样性的参考序列。这将有助于使参考对所有人都有用,从而有助于减少传播健康差异的机会,“NHGRI主任Eric Green博士说。“创建和增强人类泛基因组参考符合NHGRI的目标,即在基因组学研究的各个方面努力实现全球多样性,这对于推进基因组知识和公平实施基因组医学至关重要。

根据这一努力,人类泛基因组参考联盟包括一个嵌入式伦理小组,该小组正在努力预测具有挑战性的问题并帮助指导知情同意,优先考虑不同样本的研究,探索有关临床采用的可能监管问题,并与国际和土著社区合作,将他们的基因组序列纳入这些更广泛的努力。