1千克DNA存储全世界 1千克( 二 )


新一代测序技术发展迅速 , 现在我们可以很容易地同时读取数百万个DNA序列 , 这意味着可以同时运行和分析数千个实验 。用新一代测序技术分析DNA条形码有着独特的数据管理模式:科学家不再一次测试一个想法 , 而是做出20000个预测并同时进行测试 , 寻找正确的结果 。
生物学家是第一批广泛使用DNA条形码技术的人 。随着这种技术越来越普及 , 包括化学工程和材料科学在内 , 许多不同领域的研究人员都开始使用该技术 , 以全新的规模进行实验 。例如 , 在我设于佐治亚理工学院的实验室中 , 工程师正在使用DNA条形码来改良纳米颗粒的设计和功能 , 以便让它们安全地将药物递送到患病细胞 。纳米技术主要依赖物理和化学工程 , 似乎与DNA完全无关 。但是 , 当你将DNA视为跟踪和存储数据的一种方式时 , 它作为一种组织工具的效用就变得显而易见了 。
纳米技术专家面临的一个基本问题是 , 在寻找有效的疗法时 , 设计实验远比执行实验和分析结果容易得多 。这是因为纳米颗粒的形状、大小、电荷、化学成分和许多其他变量都可以改变它们将基因药物递送到患病细胞的能力 。此外 , 这些因素之间还会相互影响 , 使研究人员难以预测哪种纳米颗粒能以最有针对性的方式给药 。一个直截了当的方法是逐个评估每个纳米颗粒 。但是 , 曾开发过RNA药物纳米颗粒的制药公司的数据表明 , 这种类型的测试通常需要数亿美元才能完成 。
这就是DNA的存储能力可以大展拳脚的地方 。为了增加我们能够测试的纳米颗粒的数量 , 我们可以设计数千种具有不同化学结构的纳米颗粒——例如大的、带正电的球体或电中性的小三角形 , 并为每种纳米颗粒分配一个DNA条形码 。
纳米颗粒1号 , 具有1号化学结构 , 携带1号DNA条形码 。纳米颗粒2号 , 具有2号化学结构 , 携带2号DNA条形码 。我们多次重复这个标记过程 , 从而产生许多不同的纳米颗粒 , 每个都有自己独特的DNA标签 。之后 , 我们可以给患病细胞使用数百种纳米颗粒 。为了鉴定给药效果最好的纳米颗粒 , 我们使用DNA测序来读取细胞内的条形码 。
这样的实验规模在纳米医学领域是前所未有的 。在我的研究领域内 , “传统方法”一般只能产生1~5个数据点 。到2019年年底 , 我的实验室希望量化500种不同的纳米颗粒将基因治疗药物递送给40种不同类型细胞的效果 。这意味着我们要同时运行20000个实验 。
因此 , 我们还需要创建一个能够监控数据质量的数据分析管道 , 并帮助我们对结果进行统计测试 。首先我们会检验某个实验多次重复的结果是否能预测其他实验中的递送效果 。一旦我们确认这个大数据集是可靠的 , 我们就会使用统计方法来分析纳米颗粒的特征——例如它们尺寸的大小——是否对药物递送的效果有影响 。我们发现 , 决定给药效果的是纳米颗粒的化学性质 , 而不是尺寸大小 。通过DNA条形码标记 , 我们希望使用更少的资源 , 更快地发现安全的基因疗法 。我们的目标之一是找到一种纳米颗粒 , 它能针对特定细胞递送基因治疗药物 , 帮助杀死肿瘤 , 从而减少现有治疗方法所带来的副作用 , 如恶心和脱发 。
我们已经取得了一些成果 。在2018年 , 通过使用DNA条形码技术获得大数据集 , 我们迅速找到了一种新型的纳米颗粒 , 它能够高效地把基因治疗药物递送给血管内皮细胞以及几种帮助身体抵御疾病的免疫细胞 。过去 , 免疫细胞中蛋白质的活性是“没办法用药物改变的” , 也就是说 , 这些蛋白质很难作为化学小分子或抗体的靶标 , 而如今新型纳米颗粒的发现意味着我们可以攻克这一难关 , 开发出新的治疗方法 。在2018年和2019年 , 我们在《美国科学院院刊》(Proceedings of the National Academy of Sciences)、《先进材料》(Advanced Materials)和《美国化学会杂志》(Journal of the American Chemical Society)等期刊上发表了研究数据 , 从而得到了众多其他基因疗法研究者的关注 。我们还组建了一家新公司GuideRx , 致力于高效率地开发安全的基因疗法 。