中国基因网您的位置:首页 >基因科普 >

自动化微生物基因组序列去污

单细胞基因组学和宏基因组学是开创性的技术,帮助研究人员评估环境微生物群落的结构和功能。然而,随着应用这些技术的项目不断扩大,研究人员因缺乏检查组装基因组序列的高通量过程而受到阻碍。目前,上传到公共数据库的微生物基因组的序列去污是一个手动且耗时的过程,需要有关污染物序列的信息才能将其去除。

自动化微生物基因组序列去污

为了帮助解决这一障碍,来自美国能源部联合基因组研究所(DOE JGI)的原核超级计划团队,DOE科学用户设施办公室,开发了第一个快速自动清除污染物序列的计算协议。基因组草案。他们描述了所谓的ProDeGe(工具专业为母育德的污染戈在nomes)在网上公布2015年6月9日研究的ISME杂志。本文取得的ISME杂志的下载次数最多的文章的十大排行榜,因为它的发行。

虽然研究小组表示ProDeGe适用于任何类型的基因组序列,但是对于该研究,它使用来自两个公开数据集的182个手动筛选的单个扩增基因组(SAG)进行基准测试,其中一个是微生物暗物质项目,另一个是使用拟南芥内生菌。由北卡罗来纳大学的合作者提供的数据,他们正在共同撰写本文。

快速序列去污

该工具报告称,该工具将序列分类为“清洁”或“污染物”,并以每兆碱基序列0.30 CPU核心小时的速率运行。该研究的第一作者Kristin Tennessen指出,“需要专家大约6个小时手动净化1兆碱基的序列”,因此使用ProDeGe会导致加速约20倍。如果手动用户缺乏经验,她补充说,去污率的增加甚至可以更大。

DOE JGI的Prokaryote超级计划负责人Nikos Kyrpides表示,ProDeGe等软件解决方案的出现令人畏惧的计算挑战与该研究所10年战略愿景的三大“支柱”之一一致。“他强调生物数据解释,”他补充说,“DOE JGI在开发,标准化和为用户提供高质量基因组装配,注释和其他计算基因组学工具的访问方面发挥了领导作用。”

ProDeGe经过预先校准,可以去除至少84%的污染物序列,该团队发现,当它可以将测试序列与数据库中对应于Class级别或更深层次的同源物进行比较时,它表现最佳。该研究小组报告说,如果序列属于新型生物,ProDeGe仅通过检查序列组成来去除污染物。

“鉴于每年产生的大量环境序列信息以及单细胞基因组测序的日益普及,”不列颠哥伦比亚大学的长期DOE JGI合作者和ProDeGe用户Steven Hallam说。“ProDeGe填补了QA / QC工作流程中的一个关键缺口,实际上可以在个人用户和平台服务之间有效扩展。”

研究小组补充说,“ProDeGe是建立培养和未培养微生物基因组质量控制标准的第一步。它有助于防止污染的序列数据传播到公共数据库,避免产生误导性分析。管道的全自动化特性使科学家们无需数小时的人工筛选,生成可靠的干净数据集,并首次实现数据集的高通量筛选。因此,在下一代DNA测序和不依赖培养的微生物基因组学的时代,ProDeGe代表了我们工具包中的关键组成部分。“

作为使用ProDeGe工具的人,Bigelow实验室单细胞基因组学中心主任Ramunas Stepanaukas和DOE JGI合作者补充说,“单细胞基因组学和宏基因组学已经成为未培养微生物生物学信息的主要来源。 ,这是我们星球上大多数生态系统的主要组成部分。DNA污染的风险是单细胞基因组测序和宏基因组装配的重大挑战。从单细胞基因组学和宏基因组数据中预防,检测和去除污染物对于了解我们星球上的生态系统至关重要。新的实验室和计算工具,如ProDeGe,对于确保这些新兴研究领域的高标准数据质量至关重要。“

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容