1千克DNA存储全世界 1千克( 四 )


通过对大肠杆菌的DNA进行测序 , 研究者以90%以上的准确度复原了原始图像 。接下来 , 他们重复了这个实验 , 但加入了一个重要的变化:他们分不同批次将信息写入DNA , 还开发了一种方法来分析记录了信息的DNA序列相对于彼此的位置 。通过测量序列添加到大肠杆菌基因组中的次序 , 他们能够将一系列图像写入基因组中 , 从而编码一部电影 。研究人员把取自人类的第一部电影的GIF动图录入了基因组 。这个电影是埃德沃德·迈布里奇(Eadweard Muybridge)于1878年创作的 , 展现的是奔跑中的马 。在2017年发表的论文中 , 研究人员证明 , 他们通过对细菌基因组进行测序 , 成功还原出了这部迈布里奇的著名电影 。
通用的DNA存储技术随着研究者在越来越多的领域中用DNA生成、跟踪和存储信息 , 一个问题浮上水面:DNA最终是否能与传统的电子存储设备竞争 , 来记录人类生成的所有数字数据?现在的答案是否定的——在保存信息方面 , 硬盘和闪存设备要远远优于最先进的DNA系统 。
但是像所有的技术一样 , 传统的电子设备也有局限性 。它们占用物理空间 , 需要特定的环境条件;即使是最耐用的电子设备也不太可能存活超过几十年 。考虑到这些问题 , 要保存我们今天所生成的所有数据可能很快就会变得困难起来 。
相比之下 , 如果保存在凉爽干燥的环境中 , DNA几乎肯定可以维持几万年不变 。它可以在-20℃甚至-80℃的低温实验室条件下保存 , 也可以存储在一般电子产品无法承受的极端炎热的环境中 。2015年 , 苏黎世联邦理工学院的罗伯特·格拉斯(Robert Grass)和文德林·斯塔克(Wendelin Stark)证明 , 存储在二氧化硅中的DNA能够在70℃下保存一周而不会产生任何差错 。尽管硬盘每平方英寸可以容纳1TB的数据 , 但最近的估算表明 , 全世界产生的所有信息都可以保存在不到1千克的DNA中 。
要使DNA储存技术得到普及 , 还有许多重大的技术难关需要克服 。主要的限制是存储信息方式与提取信息的方式完全不同 。此外 , 从硬盘中获取数据几乎是即时的 , 而从DNA中提取数据需要测序 , 目前需要几分钟到一天才能完成 。尽管在过去的几年里DNA测序仪有了巨大的飞跃 , 但与硬盘相比 , 它们仍然体积庞大 , 价格昂贵 。
在DNA存储能够充分发挥其潜力之前 , 我们必须考虑的不仅仅是这些技术障碍 。作为一个社会 , 我们需要认识到 , DNA测序的无处不在也意味着追踪一个人将变得更加容易 , 同时数据安全也将出现新的漏洞 。在美国和全球范围内 , 隐私问题的例子比比皆是 。
美国各地的警察部门已经在使用DNA测序 , 但很少受到监督 。通过要求所有被捕人员——哪怕是最轻微的犯罪——提供DNA样本 , 警方正在建立基因信息的大型数据库 。有些人认为这是21世纪的“指纹”识别技术 。但两者有一个关键的区别 。指纹只能识别一个人 , 但如果你的一个亲戚提供了他或她的DNA , 那么这位亲戚暴露的信息就可被用来识别你或你家庭中的任何其他成员 。
目前 , 关于DNA存储的这些担忧涉及的都是一个人的遗传密码本身——相关讨论也一直是围绕着身份保护展开的 。但是在将来 , 如果其他类别的信息 , 如医疗数据、法律契约和个人数字历史都存储在DNA中 , DNA存储在物理安全和网络安全等方面的更多问题就会暴露出来 。既然如此多的信息可以保存在这么小的空间里 , 那么该如何分配数据以避免在一个地方过于集中呢?即便信息提取过程能得到简化 , 又该怎样在避免恶意攻击或意外损失的前提下 , 对数据进行常规存取呢?
考虑到科学和伦理两方面需要完成的艰巨工作 , DNA存储实用化的难度似乎令人望而生畏 。这会让我想起莱特兄弟 , 因为我的故乡 , 俄亥俄州的一个小镇 , 也是他们出生成长的地方 。他们的第一次飞行持续了12秒 , 只前进了37米 。而60年后 , 在没有现代计算机帮助的情况下 , 人类登上了月球 。这些壮举使我相信 , 我们可以在未来几十年驾驭DNA的天然力量 , 并主动地认识它的破坏力 , 确保这项技术为人类造福 。