技术贴——师兄弟大PK | 三代测序的倚天剑对砍二代测序的屠龙刀
测序技术速概览——纳米孔测序技术的两大重要成果之后两个普通的研究生之间的对话
2018年的一月即将过去,最后一天,生物科研狗小明依然留守在学校,期待着一个人(一个人,是一个人!!!)观赏晚上的超级蓝月。正在小明百无聊赖的看文献的时候,小明的好基友,小袁拿着两篇文献跑过来,大声喊着不得了啦,不得了啦,牛津的纳米孔公司连搞了两个大新闻,首个基于纳米孔测序技术的不使用PCR扩增的RNA-seq技术[1]问世啦,首个基于纳米孔测序技术的超长读长组装的人类基因组的发表啦[2]。
小明(尴尬而困惑)
大兄弟,小点声,,,,不要激动,不要激动。这么说,第三代测序技术又搞大新闻了?我一直傻傻分不清楚一代测序,二代测序,三代测序之间的区别。虽然测序公司天天来我们实验室晃悠,各种安利。上课的时候有些老师又暗暗嘲讽测序公司,讽刺它们不懂遗传学,你说这测序,它到底有多大用呀?
小袁(颇为高兴的说)
我给你讲啊,,,
小明
小点声,我感觉那位在配胶的师兄想过来打你
小袁(囧)
大熊弟,是这么回事呢。你的问题有点多,我们先回忆一下这三代测序吧。考考你,第一个测得DNA序列的人是谁呀?
小明
我知道,是吴瑞先生。要是我能发个好文章,也许就可以得吴瑞奖学金了呢。
小袁
苟富贵,勿相忘。老铁到时候记得请客呀。吴瑞先生1968年利用引物延伸的思路,测得了λ噬菌体的粘性末端,之后1976年,Sanger和Gilbert分别提出链终止的策略将测序长度从十几个碱基提升到了上百个碱基。这个时候一代测序就初具雏形。后来经过工程师们的改良,现在的成熟的一代测序原理是这样,分子生物学课上学过,还记得不:
(小袁拿出随身携带的Pad,show了一张图)
图1:一代测序原理[3]
小袁
人类基因组计划,就是靠一代测序完成的,把基因组DNA提出来之后,打断(用超声波等),然后把这些片段,用分子克隆的手段,转到大肠杆菌里进行扩增,这步的目的是为了放大信号,构建得到所谓的文库(library)。接下来,我们以文库中的DNA为模板,边合成,一边通过每次增加一个碱基所释放的不同的荧光信号最得到我们想要的序列信息。我们这只是得到一条序列的信息,重复同样的步骤,我们会得到很多序列,怎么把这些序列拼成我们想要的人类基因组呢,这是生物信息行业的先行者们所解决的问题,称为Assembly。这其中有很多技术细节,不过都是计算机科学里的东西,啊,这个啊,很复杂,我们就不谈了。
小明(暗中腹诽)
其实是你不懂吧。。。
小袁(继续滔滔不绝地说)
一代测序现在在我们的科研中还是很常用的,比如说你想看你构建的载体是否成功,或者某个位点如你所愿的被编辑了。比如说,张锋的一篇经典的Science中有张图,我们可以用一代测序检测,相比野生型,我们是否对感兴趣的基因进行了基因编辑。
图2:用一代测序检测基因编辑效果
小明
原来我打交道比较多的一代测序呀。
小袁
嗯。人类基因组计划完成之后,说到底,我们得到不过是一堆ATGC组成的字符串罢了,然而基因不单单是一堆字符串,它上面的化学修饰信息,转录调控的信息,一代测序并不能告诉我们。加之成本的原因(我觉得是分子克隆的步骤),一代测序费时费力费钱。所以,工程师与科学家们联合起来,发明了第二代测序技术,也称为下一代测序技术(NGS),目前主流的是Illumina公司的方案。
二代测序的特点是,首先,我们不构建所谓的BAC文库了,而是使用给打碎的片段加接头,然后桥式PCR扩增的手段实现边合成,边给每次合成的小池里拍照,于是照片上的每个像素点,就是这一轮循环该位置所对应的序列的碱基。我们,多个循环拍照,我们便能并行得到多个序列的序列信息了。不过由于技术限制,我们测序每条序列长度(称为reads),很小。这其中的影响我们后面再谈。
由于并行化,NGS减少了测得人类基因的成本。而且将生物学研究代入了高通量时代。
小明
对对,这个我经常听说,什么高通量,什么组学,好像就是因为NGS,所以大家现在都想做点儿生信。
小袁
嗯,不过我们要看看表现背后的内在逻辑。你知道,我们现在所做的绝大多数生物学研究都可以归结为一个大问题,基因的转录调控。在转录调控中,有两个关键的问题,转录因子的结合与基因的表达。
在NGS发明之前,为了研究转录因子结合位点,我们可以使用染色体免疫共沉淀的方法,通过抗原抗体特异结合的思路捞出和我们的转录因子互作的DNA片段,用一代测序的手段,知道这些片段的信息。但是,我们怎么知道我们感兴趣的转录因子在全基因组中的结合信息呢。2007年,结合NGS研究者想出了一种被称作ChIP-seq的策略。说白了就是ChIP+NGS,把ChIP得到的序列,从蛋白中分离,加接头,直接上NGS,我们把转录因子,或者更广义的蛋白结合DNA的问题转化为了一个测序问题,而且我们得到的这个基因组的转录因子结合信息。
转录调控的另一个问题是基因的表达,在NGS出现之前RT-qPCR和基因芯片能让我们知道我们感兴趣的特异的某个基因,或者很多基因的表达。但是,如果我们想知道,病人相比于正常人的所有的RNA构成的转录组的表达情况呢。显然这些技术,并不能回答问题。2009年,基于NGS,研究者开发出了RNA-seq。实现了转录组的测序。
图3.Illumina公司的二代测序方案[3]
RNA-seq之后,NGS的才算迎来了蓬勃的发展。你懂得,生物研究中,大部分都是假设驱动的,一直有这么个说法,在做实验之前,其实我们已经知道,我们想看见什么了,NGS多少将假设驱动的转化为了数据驱动。我们不用费劲心思挑出一些基因去做ChIP或者qPCR了,而且我们还能发现一些新的通路。这确实是个很让人振奋的消息。
值得一提的是,研究者们对NGS进行了些许改进,开发出了单细胞转录组测序技术。对人类一些珍贵的细胞,比如卵细胞和精子,现在可以用单细胞技术进行测序[4],以达到产前诊断的目的。此外,我们还可以对异质性特别高的肿瘤细胞进行单细胞测序,寻找对抗肿瘤的策略[5]。
再提一点,如果你仔细看文献的,你会发现,每一种新的NGS技术出来之后,他们首先测的通常会是免疫细胞,因为免疫与医疗关系紧密,这其中有丰厚的转化价值。
小明
你们是不是做这个的,教练,我想学如何分析NGS!
小袁
嗯嗯。其实网上有很多教程,有很多论坛。而且一些优质的资源也并不是需要付费的,比如有个叫做生信菜鸟团的论坛,就挺好的。闲话少说,我们开始讲第三代测序了。其实啊,一代测序与二代测序,我们两个学过分子生物学的理解起来还是很容易,但是一个外行,没有任何分子生物学基础,旁听我们说了这么多的话,也许会一头雾水,为啥,测个序这么麻烦,就没有什么简单粗暴,而又直观的方法呢。有,单分子测序中的纳米孔测序的策略,就是这其中的代表。
我们知道,DNA一条链的直径大约是1nm,如果我们让直径为1nm的DNA分子通过一个只能容许它一个大分子的孔,并且能检测每个碱基在通过这个孔时的引起的变化,不久可以很巧妙的实现了测序策略吗?可惜,这个想法,并不是我们最先想到的,1989年,一位叫做David Deamer的人在他的实验记录本上记下了和我们一样的想法[6]。DNA通过某种通道蛋白,我们可以把碱基通过这种通道蛋白所引起的电化学变化,来确定这个碱基到底是A,T,G还是C.
纳米孔测序想法很棒,也很容易让人理解。但是实现起来要克服很多工程学的障碍,比如纳米孔的改造,数据处理中无法忍受的巨大噪音。虽然如此,纳米孔测序技术还是很有前景的。比如说,我们知道人类基因组中有非常多的重复序列,我们对于这些重复序列功能,了解的其实还并不是非常清楚。而要了解重复序列的功能,仅仅通过NGS这种短reads的策略,我们需要测得很深,这是很费钱,而且数据处理上又是很麻烦的,但是纳米孔可以使得我们可以测得很长的reads。比如这次我们看见的的纳米孔公司拼装的人类基因组,最长的reads竟然达到了882 kb[2]!这是很令人振奋的。
值得注意的是,纳米孔公司还针对酵母,利用纳米孔技术,进行了不使用PCR的RNA-seq,尽管他们在讨论部分说,这种RNA-seq还不成熟,数据质量与分析的流程还有待优化。但是这还是值得让人注意的事情。是否会重演一次当年基因芯片被逐渐淘汰的革命性变化呢。我们拭目以待吧。
小明
诶,筒子们你们咋都围过来了呢?
(只见众人搬着小板凳围在两人的身边)
图4 David Deamer的笔记本[6]
图5 纳米孔测序示意图[3]
参考文献
1.Garalde, D.R., et al., Highly parallel direct RNA sequencing on an array of nanopores. Nat Methods, 2018.
2.Jain, M., et al., Nanopore sequencing and assembly of a human genome with ultra-long reads. Nature Biotechnology, 2018.
3.Shendure, J., et al., DNA sequencing at 40: past, present and future. Nature, 2017. 550(7676): p. 345-353.
4.Hou, Y., et al., Genome analyses of single human oocytes. Cell, 2013. 155(7): p. 1492-506.
5.Zheng, C., et al., Landscape of Infiltrating T Cells in Liver Cancer Revealed by Single-Cell Sequencing. Cell, 2017. 169(7): p. 1342-1356 e16.
6.Deamer, D., M. Akeson, and D. Branton, Three decades of nanopore sequencing. Nat Biotechnol, 2016. 34(5): p. 518-24.
关注科学,助力科研,易科学一直在努力
易科学
让科技研发更简单!
猜你喜欢
青年留美海归学者:不愿混吃等死,回来还是想折腾一下
如何写作Science文章? 一个发表过13篇Science和Nature文章的老外的建议
【成都】(视频)(大学校园/生命科学版)
还记得小时候的“东西南北”折纸吗?哈佛大学的科学家造了个高级版的 | 科学美图
两个清华女生要帮助科研单身狗们脱单,还要派发10万元现金红包!
顶级期刊揭示:粪便治疗再上新台阶 ——癌症患者的新福音,粪便治疗助力抗PD-1免疫疗法
跳舞界第一流的科学家-王晓东实验室2018新年视频
多图实锤 | 道不完的读博苦与累
克隆猴背后:土博士炼成细胞“去核”第一人
一路开挂!90后女孩当上知名高校副院长!
2017年度“中国生命科学十大进展”
协和换帅 王辰院士正式履新 | 王院士语录集锦
圆你一千个小目标,你干不干
央视报道:日本干细胞研究造假,诺奖得主道歉或将辞去重要职位
新闻评论 | 终于,谷歌成功重返中国!出国党最爱的生活神器,在天朝也能分分钟Get
投稿、授权、合作事宜请联系resource@yikexue.com
或微信ID: yikexue2015
长按二维码识别,可以关注/进入公众号进行回复。
点击“阅读原文”,进入易科学公开课
- 股票技术指标分析:MACD形态操作策略
- 王者荣耀:拿什么拯救你的嬴政?大兄弟醒醒,你的真心没得救了!
- 股票技术分析:如何判断庄家是否吸筹和确认主力吸筹
- 特朗普女儿100张照片曝光:这就是美国三代培养的一个贵族!
- 英镑:多头反攻!对决美元升破1.4000胜势沙场!技术面给出关键位
- 我在非洲当“老师”,这位技术男让山东制造走出国门
- 摄影穷三代,单反毁一生?这已经成为了历史。。
- 2018年,新的生物技术将带给我们哪些惊喜?
- 金市展望:美元跌势未完结 黄金技术面出现两大重磅信号
- 技术分析:黄金来到关键节点 多头正寻求最终击破1366美元关键水