中国基因网您的位置:首页 >基因科普 >

祖先基因序列重建通过合成系统发育进行基准测试

已灭绝的猴子的遗骸与蜥蜴,水母和其他动物一起藏在你体内。你的DNA建立在原始祖先的基因片段之上。现在佐治亚理工学院的研究人员更有可能准确地识别和重建祖先基因以及祖先蛋白质。研究人员的见解还可以帮助科学家利用古老的基因序列合成更好的蛋白质来对抗疾病。

祖先基因序列重建通过合成系统发育进行基准测试

大约20年来,科学家们已经使用算法来计算他们数亿年前回到进化过去的方式。从现在的基因序列开始,他们执行所谓的祖先序列重建(ASR)来确定过去的突变并找出基因的原始先行者。但ASR算法面临逻辑批评。基于这些原始基因的物种已经灭绝,科学家们无法及时回过头来观察从那以后发生过的突变。那么,如何才能找到任何物理基准来验证和衡量ASR?

时间旅行替代品

佐治亚理工学院生物科学学院副教授Eric Gaucher领导的一个研究小组通过建立一个由无数突变构成的进化框架来实现这一目标。然后他们针对它对ASR算法进行了基准测试 - 无需时间机器。

他们的结果使人们相信,广泛使用的算法正在按预期工作。

“他们中的大多数都做得非常好 - 准确率高达98%,”高雪谈到当代算法计算古代基因序列的能力。他们对由这些序列编码的蛋白质的测定几乎是完美的。

高雪,研究协调员Ryan Randall和本科生Caelan Radford于2016年9月15日星期四在Nature Communications杂志上发表了他们的研究结果。他们的研究由NASA外生物学计划,EI du Pont de Nemours and Company(杜邦)和国家科学基金会资助。

“在ASR的帮助下,我们现在可以在实验室中实际构建这些古老的基因并表达它们编码的古老蛋白质,”戈谢说。“我们可以自信地做到这一点。” 在一个单独的项目中,他的实验室正在计算古老的蛋白质,这些蛋白质在8000万年前的血液凝固中非常有效,希望用它们来对抗今天的血友病。

全息树枝

祖先序列重建就像为基因制作家谱。

树梢上的许多枝条和树枝将是今天活着的物种的序列。在树上晃动,称为遗传学中的系统发育,你会发现他们的共同祖先,数百万年,在较低的分支。

有一个警告; 没有任何较低的分支存在。它们在带有这些基因序列的物种灭绝时消失了。

ASR使用基于科学进化模型的算法将它们计算回原位。这就像用全息重复替换缺失的分支。算法赛马

这些演化模型的准确性一直是一个历史性的关键点。对基于它们的算法的怀疑在一些圈子中徘徊,这些圈子坚持一个古老的,经过验证的算法。

因此,戈谢和研究员协调员兰德尔在与通用或“简约”算法的竞赛中使用当代基于模型或“最大可能性”的算法。

“简约遵循最简单的进化概念,即发生非常小的突变,”兰德尔说。相比之下,当代“最大似然”算法背后的模型与细节细节相结合。

对于这场比赛,兰德尔通过将基因序列通过多个突变来构建真实的系统发育来进行各种研究。她使用的方法非常模仿自然进化,但速度要快得多。

彩虹赛马场

在细胞中,称为聚合酶的酶有助于DNA复制。他们的工作非常有效,但他们罕见的错误是最常见的突变来源,兰德尔从此带头。

“我们使用的聚合酶容易出错,加速突变,加速进化,”她说。

在实验室进化的起始点使用的基因产生了一种蛋白质,当置于细菌中时会发出红色荧光。随着重大突变的出现,蛋白质开始改变颜色。含有绿色荧光蛋白的细菌突然出现在红色细菌中。

兰德尔将具有重大突变的细菌分成新的群体,随着她去了,在系统发育中创造了分支。许多突变产生了新的颜色 - 黄色,橙色,蓝色,粉红色 - 而Randall最终得到了彩虹色的基因家族树。

告诉我表型

颜色不仅反映了新的基因序列,还反映了新的表型 - 它们产生的实际蛋白质,生物体的工作分子。

“重要的是表型,”戈谢说。“当你严格单独分析DNA时,它忽略了DNA与表型相关的背景,”他说。DNA可以突变并仍然编码相同的氨基酸,蛋白质的组成部分。然后突变没有实际效果。但是当突变导致DNA编码不同的氨基酸时,它们就会变得更加重要。

因此,祖先序列重建算法的有价值测试必须包括表型。兰德尔在选择突变蛋白时考虑到了这一点。

“我选择变种来故意使算法难以推断出表型,”她说。接下来的比赛,算法得到有限的信息,以推断进化树的许多过去的突变。

肯定的赌注

虽然经过验证的简约算法表现良好,但最大似然性能更好。“虽然它得到了与简约相同数量的残基(DNA序列)错误,但错误推断的序列仍然更有可能编码正确的表型,”本科生Caelan Radford说,他分析了实验的统计数据。

误差范围很小,不会干扰过去物种的确定。

实验的结果并不太令人惊讶,因为先前的模拟预测了它。但研究人员希望科学界能够获得比计算机证明更可靠的物理证据。“这是一种计算机算法。它会做你要告诉它的事情,”戈谢说。

ASR简史

关于祖先序列重建的怀疑 - 特别是最大似然算法 - 可以追溯到很久以前。执行ASR的想法首先出现在1963年,但它直到20世纪90年代才开始,当时,研究人员对广泛的方法进行了激烈的斗争。

“人们会想出最疯狂的概念,为什么一个模型最好,”戈谢说。“他们会说,'好吧,如果我在这里沿着这些分支模拟这种奇怪的进化模式,我的算法将比你的算法更好。”

简约算法是一种统治混乱的方式,这种混乱源于当时进化模型中缺乏数据。“当模型出错时,”最大可能性“会失败,”戈谢说。

但是,现在,大量的数据和分析为科学家们提供了进化如何运作的伟大图景(并且它不是简约原则):对于年龄,没有任何动作,然后改变爆发,然后事情再次稳定下来。

“你得到了这种快速发展,因此很多东西都有效,很多东西都失败了,那些有效的东西继续存在,并保持其状态并且不会改变,”戈谢说。通过确认算法的高精度,佐治亚理工学院团队也证实了他们所基于的当前进化科学的有效性。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容