我的科学家开发了新的算法,将基因测序速度提高了5倍

12月9日,中国农业科学院农业基因组研究所阮珏团队在国际期刊《自然方法论》上发表了wtdbg第三代测序数据组装算法,极大地提高了第三代测序数据的分析效率。实验表明,与2019年4月1日发表在《自然生物技术》(Nature Biotechnology)上的Flye算法相比,该算法的分析速度提高了5倍,测序数据的分析时间首次减少到小于测序数据的产生时间。

阮珏的团队介绍说,基因组技术的快速进步不仅是由于测序技术的发展,还取决于数据分析技术的改进。以第三代测序为例,完成一个人的全基因组测序只需一天,成本不到5万元。然而,在2014年将需要500,000个处理器小时来完成这样一个数据规模的全基因组装配分析,这只能在超大型计算机集群上进行。在这种情况下,很难想象同时聚集和分析大量的个体。

近年来,生物信息学领域的科学家致力于改变数据输出速度远高于数据分析速度的尴尬局面,不断开发更高效的装配分析算法。中国农业科学院农业基因组研究所成立之初,成立了基因组技术研究中心,致力于将尖端测序技术引入农业科学研究。阮珏的团队多年来一直专注于测序数据分析方法(如汇编算法)的开发,努力提升测序数据更快的分析速度和更高的分析质量。

这项研究发表于2013年,由研究员阮珏与美国哈佛医学院的亨利博士合作完成。自2016年以来,所有人都可以免费获得研究结果。近年来,它们不仅被数十篇学术论文引用,还被国内许多基因测序和分析公司用作主要的装配分析工具。它们也被用作2019年世界大学超级计算机竞赛的性能测试题。(光明日报全媒体记者杨舒记者谢欣和赵华)

大家都在看

相关专题