中国基因网您的位置:首页 >基因科普 >

最大容量的估计预测一克单链DNA可以存储多达一个exabyte的数据

在20世纪80年代首次证明了将信息编码到DNA中,但当时的技术只允许编码一个图形符号。虽然这个容量在过去的30年中有所增长,但是迄今为止最大的项目,在2010年完成,仅管理了7,920位数据,相当于大约半页的打印文本。哈佛大学和约翰霍普金斯大学的研究人员今天在“ 科学”杂志上使用了一种新技术,现已将一本53,000字的书编成DNA,包括11个JPG图像和一个JavaScript程序。

最大容量的估计预测一克单链DNA可以存储多达一个exabyte的数据

“其他人指出,DNA具有一定的优势,”研究报告的共同作者Sriram Kosuri说。“但是没有人真正把它带到我们能够编写真正有用的信息量的水平。”

这些优点包括可以存储的信息密度:最大容量的估计预测一克单链DNA可以存储多达一个exabyte(10 18字节)的数据。然而,合成和测序DNA带来许多固有的错误。合成DNA通常在每70个中具有一个不正确的核苷酸,并且下一代测序技术在解释存储的数据时会犯许多错误。

为了克服这些错误,团队将基数A和C分配为0,将G和T分配为1,从而创建数字数据流。手稿及其伴奏 - 由该研究的一位作者乔治·丘奇共同撰写的一本书的草稿,称为“ 再生:合成生物学将如何重塑自然和我们自己” - 在被翻译成0流和之前被转换为HTML。 1s可以写入DNA序列。得到的流长5.27兆比特,或527百万0和1秒。

以前的方法在尝试在一个长DNA序列中创建整个流时遇到了问题,这是一个棘手且昂贵的过程。该团队的解决方案是将流分成更小的部分。他们编码每个短核苷酸部分96位,称为寡核苷酸,每个核苷酸包含一个19位“地址”,以便对整个序列中的信息进行排序。每种寡核苷酸合成多次,因此在读取时,可以在每个拷贝中比较错误并且可以达到共识读数。

“这与你对人类基因组进行测序的方式类似,你不会对它进行一次排序,你可以按30或50倍的顺序进行排序,你只需在每个位置做出共识,”Kosuri说。

合成序列并将DNA滴连接到微阵列芯片后,将数据在4摄氏度下储存3个月,然后溶解在水中,通过PCR扩增,并测序。通过存储多个副本,并对每个副本进行多次排序以达成共识,该团队设法解码了整个527万位序列,只有10位错误。

“他们提出了一种非常聪明的方法来管理信息创建中的错误,”应用分子进化基金会的合成生物学家Steven Benner说,他没有参与这项研究。“[作者]提供了一些巧妙的方法来解决这些问题,允许在大量分子中读取含有所需信息的少数分子。”

虽然DNA存储不可重写,并且不打算替换您的硬盘,但是在非常小的空间内长期存储大量数据的想法对于存档记录和数据具有优势。与像CD一样的平盘相比,只有表面上刻有数据,一张DNA在整个厚度上都有数据存储。然而,仍然存在的主要挑战是当今合成和测序技术的成本和效率,这些技术目前使该系统不适合常规使用。然而,随着测序成本的持续下降和技术的不断发展,这种DNA存储策略可能很快变得更加实用。

必须克服的另一个挑战是保护。DNA仍然可以从数千年前干燥的木乃伊中测序,但这种序列很少完成。

“DNA的化学反应不容易发展到世纪级的被动,无包装的档案,”本纳说。“然而,鉴于其存在极高密度存储的潜力,本文应该鼓励人们应对基于分子的信息存储的挑战。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

推荐内容