美国国立卫生研究院的研究人员开发并发布了一种创新的软件工具,用于组装来自各种物种的真正完整(即无缝)的基因组序列。这种名为Verkko的软件在芬兰语中意为“网络”,它使组装完整基因组序列的过程更加经济实惠且易于使用。新软件的描述今天发表在NatureBiotechnology上。

软件按需组装完整的基因组序列

Verkko从组装第一个无间隙人类基因组序列中成长起来,该序列由端粒到端粒(T2T)联盟于去年完成。

“我们利用了我们在T2T项目中学到的一切,并使该过程自动化,”NHGRI副研究员谢尔盖·科伦博士说,他领导了Verkko的创建,并且是该论文的资深作者。“现在有了Verkko,我们基本上可以按下一个按钮并自动获得完整的基因组序列。”

T2T联盟使用新的DNA测序技术和分析方法来生成和组装剩余的8%–10%的人类基因组序列。然而,研究人员手动组装了这些碎片——这一过程需要这个庞大且技术精湛的团队花费数年时间才能完成。Verkko可以在几天内完成同样的任务。

组装基因组序列就像拼拼图,不同的DNA测序技术会生成不同类型的基因组拼图。有些很小而且非常详细,而另一些虽然图像模糊但要大得多。Verkko比较并组装了两种类型的作品,以生成完整而准确的图片。

Verkko首先将细小的细节组合在一起,创建许多部分组装但不连续的序列片段。然后,Verkko将组装的区域与更大、更不精确的部分进行比较。这些较大的部分作为一个框架来对更详细的区域进行排序。最终产品是准确而完整的基因组序列。

研究人员使用人类和非人类基因组测序数据测试了Verkko。该软件快速准确地组装了整个染色体的序列,这曾经是一项艰苦的壮举。

随着Verkko导致更完整的人类基因组序列,研究人员可以更好地评估人类基因组多样性。由于只有一个完整的人类基因组序列,科学家们目前缺乏对整个人类基因组许多部分多样性的了解,例如高度重复的DNA区域。

Verkko还将加快努力,生成研究中常用物种的无缝基因组序列,例如小鼠、果蝇和斑马鱼,以提高它们对科学家的实用性。此外,从各种植物、动物和其他生物中生成无缝基因组序列将有助于比较基因组学,即研究不同物种基因组之间的异同。

“Verkko可以民主化生成无缝基因组序列,”NHGRI高级研究员AdamPhillippy博士说,他曾参与T2T项目和Verkko的开发。“这种新软件将使组装完整的基因组序列尽可能便宜和常规化。”