中国基因网您的位置:首页 >基因科普 >

使用时间序列数据提高基因组作图的准确性

如果您已经拥有生物体基因组的序列图,但想要在样本中寻找结构上的奇怪现象,您可以检查基因组条形码 - 已知的目标位点之间的一系列距离 - 通过在这些位点切割DNA序列并检查切口之间的距离。然而,如果通过涉及PCR的下一代测序获得的原始图谱包含任何扩增偏差,则跨研究存在系统误差的空间。为了解决这个问题,明尼苏达大学和BioNano Genomics的研究人员通过使用动态时间序列数据来测量概率分布,或基于链是否分离两个标签的遗传物质的数量,改进了基于纳米通道的绘图形式。拉伸或压缩。

使用时间序列数据提高基因组作图的准确性

“想象一下,DNA骨架上的两个标签通过弹簧连接在一起,弹簧模拟了它们之间DNA的构型熵,”明尼苏达大学科学与工程学院教授Kevin Dorfman说。“如果这是一个谐波弹簧...那么我们可以预期在弹簧长度的其余部分看到正负位移的概率相等。”然而,Dorfman和他的同事观察到比标签之间的延伸更大的压缩,而不是这种正常的曲线,并且发现标签之间的大部分热波动是短暂的事件 - 有助于提高基因组图谱准确性的信息。

“这些改进对于复杂的样本尤其重要,例如癌症,细胞是异质的,因此我们需要高精度才能找到罕见的事件,”Dorfman说。Dorfman和他的实验室在过去三年中一直与位于圣地亚哥的BioNano Genomics的合作者合作,通过国立卫生研究院和国家科学基金会的资助。他和他的同事本周在Biomicrofluidics上详细介绍了他们的工作。

研究人员遇到的问题是传统上使用的脉冲场凝胶电泳方法 - 其中基因组图谱是通过用限制酶切割DNA序列构建的 - 位于重新组装图谱中,因为常规过程将片段作为其大小的函数进行分类。然而,在纳米通道方法中,荧光标记始终在每条链上排序。这使得研究人员可以从荧光条码中确定整条链的内容,而无需重新组装它们 - 消除了对先前获得的地图的依赖。

研究人员首先对DNA进行标记,其中包括从大肠杆菌细胞中提取基因组DNA,在不同的目标位置去除单个核苷酸和一段骨架,并在其位置插入荧光核苷酸。然后将每条DNA链(通常约300,000个碱基对)注入45nm宽的纳米通道中。这迫使分子伸展,因为DNA的弯曲长度尺度仍然以棒状,可量化的方式移动,约为50nm。

然后,他们使用数码相机对标签的位置进行成像。虽然纳米通道中DNA的典型单分子研究报告了来自数十个分子的统计数据,但研究人员的方法涉及数千个分子,每个分子都覆盖着一系列标签 - 导致数百万个标签之间的距离测量,这对于确定概率分布。

Dorfman及其同事的未来工作包括使用这些分布作为基因组图谱算法的输入。这可以用于指定特定的点序列映射到基因组的特定区域的置信度,以及帮助理解拉伸的DNA的结,折叠和环对基因组作图的影响。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容