中国基因网您的位置:首页 >国内研究 >

解码RNA-蛋白质相互作用

由于基因测序的不断进步,科学家们已经在我们的遗传密码中发现了几乎所有的A,T,C和G核苷酸。但是要完全理解人类基因组是如何编码我们的,我们需要更进一步,绘制每个基因的功能。这是DNA元素百科全书(ENCODE)项目的目标,该项目由国家人类基因组研究所资助,并在2003年人类基因组计划之后推出。虽然已经完成了许多工作 - 映射蛋白质-DNA相互作用和不同表观遗传状态的遗传 - 理解DNA序列的功能还需要破译由其编码的RNA的目的,以及哪些蛋白质与这些RNA结合。

解码RNA-蛋白质相互作用

这种RNA结合蛋白(RBPs)通过控制各种转录后过程来调节基因表达 - 指导RNA进入细胞的位置,它们的稳定性以及合成的蛋白质。然而,这些重要的RNA-蛋白质关系仍难以编目,因为大多数必要的实验难以完成且难以准确解释。

在一项新的研究中,麻省理工学院的生物学家团队及其合作者使用一步,无偏倚的方法描述了78种人类RBP的结合特异性,该方法可以有效而精确地确定这些蛋白质所需的RNA序列和结构的光谱。他们的研究结果表明,RBP不仅识别特定的RNA片段,而且通常受到上下文特征的影响,如同所讨论的RNA的折叠结构,或RNA结合序列侧翼的核苷酸。

“RNA从未在细胞中裸露,因为总有蛋白质结合,引导和修饰它,”计算和系统生物学博士生导师Christopher Burge说。该项目,生物学和生物工程教授,科赫综合癌症研究所的校外成员,麻省理工学院和哈佛大学广泛研究所的准成员,以及该研究的高级作者。“如果你真的想要了解转录后基因调控,那么你需要对这些相互作用进行表征。在这里,我们利用深度测序来更准确地描述蛋白质与RNA结合的位置和位置。”

麻省理工学院博士后Daniel Dominguez,前研究生Peter Freese和现任研究生Maria Alexis是该研究的主要作者,该研究是ENCODE项目的一部分,于6月7日出现在Molecular Cell上。

一种疯狂的方法

从RNA诞生的那一刻起,它就被RBP所覆盖,几乎控制着生命周期的每个方面。RBP通常含有结合结构域,三维折叠结构,其可附着于称为基序的RNA上的特定核苷酸序列。因为在人类基因组中发现了超过1,500种不同的RBP,生物学家需要一种方法来系统地确定哪些蛋白质与哪些RNA基序结合。

在考虑了许多不同的方法来分析RNA-蛋白质相互作用,无论是直接在细胞内(体内)还是在试管中分离(体外),生物学家都采用了一种名为RNA Bind-n-Seq的体外方法( RBNS),由前Burge实验室博士后和共同作者Nicole Lambert在四年前开发的。

尽管兰伯特之前只测试了一小部分蛋白质,但RBNS超越了其他方法,因为它是一种定量方法,揭示了低亲和力和高亲和力的RNA-蛋白质相互作用,只需要一个程序步骤,并筛选几乎所有可能的RNA基序。这项新研究提高了检测的通量,系统地以高分辨率探索超过70种人类RBP的结合特异性。

Dominguez说:“即使是最初的小样本,也很清楚RBNS是要走的路,在过去三年半的时间里,我们逐渐采用这种方法。”“由于单个RBP可以从数十亿个独特的RNA分子中进行选择,我们的方法可以为您提供更多的能力来检测所有可能的目标,同时考虑到RNA二级结构和背景特征。这是一个非常深入和详细的分析。”

首先,研究人员对人类RBPs进行了纯化,将它们与大约20个核苷酸长度的随机生成的合成RNA混合,这几乎代表了RBP可以结合的所有RNA。接下来,他们提取了RBP及其结合的RNA并对其进行测序。在加利福尼亚大学圣地亚哥分校和康涅狄格大学健康研究所的合作者的帮助下,该团队进行了额外的分析,以收集这些RNA-蛋白质相互作用在实际细胞中的样子,并推断出RBP的细胞功能。

研究人员预计大多数RBP与独特的RNA基序结合,但令他们惊讶的是,他们发现了相反的结果:许多蛋白质,无论结构类别如何,似乎都喜欢类似的短的,未展开的核苷酸序列基序。

“人类细胞表达了数十万种不同的转录本,因此您可能会认为每个RBP都会结合略微不同的RNA序列以区分目标,”Alexis说。“事实上,人们可能会认为具有不同的RBP基序将确保最大的灵活性。但事实证明,自然界已经建立了大量的冗余;多种蛋白质似乎结合了相同的短线性序列。”

具有不同目标和功能的冗余图案

RBP结合偏好的这种重叠向科学家们表明,除了基序序列之外,还必须有一些其他指示物,这些指示物表示RNA靶向的RBP。事实证明,这些信号源于图案的间距以及其结合位点侧翼的核苷酸碱基。对于靶向非线性RNA序列的较不常见的RBP,RNA折叠的精确方式似乎也影响结合特异性。

那么一个显而易见的问题是:为什么RBP已经演变为依赖于上下文特征而不是仅仅赋予它们不同的主题?

可访问性似乎是更合理的论据之一。研究人员推断线性RNA片段在物理上更容易到达,因为它们不受其他RNA链的阻碍,并且他们发现更容易接近的图案更容易受到限制。另一种可能性是,使许多蛋白质靶向相同的基序会产生一些蛋白质间的竞争。如果一种蛋白质增加RNA稳定性而另一种蛋白质降低它,那么结合最强的蛋白质将阻止另一种蛋白质完全结合,从而使细胞或细胞状态之间的基因活性发生更明显的变化。在其他情况下,具有靶向相同基序的相似功能的蛋白质可提供冗余以确保在细胞中发生调节。

“这绝对是一个难题,而且我们可能永远无法回答这个问题,”多明格斯说。“由于RBP在进化时间内重复,可能改变对RNA基序周围环境特征的识别比改变整个RNA基序更容易。这将为RBP选择不同的细胞靶标提供新的机会。”

该研究标志着ENCODE项目的首批体外贡献之一。虽然体内试验揭示了特定细胞系或其进行组织的特定信息,但RBNS将有助于确定RNA-蛋白质相互作用的基本规则 - 因此它们很可能适用于许多细胞类型和组织。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容