技术解读|RRBS测序中因酶切人为引入碱基问题单酶切RRBS双酶切RRBS
原标题:技术解读|RRBS测序中因酶切人为引入碱基问题
前言
我们都知道 , 研究哺乳动物DNA甲基化最常用的、性价比最高的技术就是RRBS技术了 。 RRBS技术是基于酶切富集CG位点的 , 在建库过程中往往会因补平酶切的粘性末端而人为引入碱基 。 这时候酶切处引入的人工C碱基如果不处理的话 , 将会影响这些位点甲基化水平的计算 。 今天小编将会从酶切引入碱基的过程入手 , 带大家一步步分析其中的缘由 , 最后给出解决人工引入碱基问题的办法 。
在常规RRBS建库过程中 , 在补平酶切接口时会引入人工的CG序列 , 这两个序列在read1中CT转化会变成3'TG,在read2中GA转化会变成5'CA , 故需要去除 , 以免影响这个位置C碱基甲基化水平的计算 。
在双酶切RRBS中 , 在补平酶切接口时会引入人工的CG和CWG序列 , read1中CT转化会变成3'TG和3'TWG,在read2中GA转化会变成5'CA和5'CWA , 故需要去除 , 以免影响这个位置C碱基甲基化水平的计算 。
为什么是如此去除?具体分析见下文:
单酶切RRBS单酶切RRBS技术采用的是MspI单酶切建库 , MspI的酶切位点如下:
文章图片
我们回顾一下单酶切RRBS建库过程:
文章图片
我们分析一下整个建库过程中酶切位点周围的碱基变化:
原序列:
5'-C|CGG=========C|CGG-3'(W链)3'-GGC|C=========GGC|C-5'(C链)
酶切后,3'端补平CG , 再加A,然后加接头:(红色字体为人工碱基)
5'-P5adapter-T|CGG=========C|CGA-P7adapter-3'(W链)3'-P7adapter-AGC|C=========GGC|T-P5adapter-5'(C链)
BS处理:
5'-P5adapter-T|TGG=========T|TGA-P7adapter-3'(BSW链)3'-P7adapter-AGT|T=========GGT|T-P5adapter-5'(BSC链)
PCR:
5'-P5adapter-T|TGG=========T|TGA-P7adapter-3'(BSW链)---read13'-P5adapter-AAC|T=========AAC|T-P7adapter-5'(BSWR链)---read2
5'-P7adapter-T|CAA=========C|CAA-P5adapter-3'(BSCR链)---read23'-P7adapter-AGT|T=========GGT|T-P5adapter-5'(BSC链)---read1
由此可见 , 最后测序得到序列中 , 人工序列有(不计算末端A和T):
read1:
3'TG
read2:
5'CA3'CA
是不是都要去除?
实际上read2的3'CA虽然是人工序列 , 却并不影响原始链(W链和C链)中5'CGG中C碱基甲基化水平的计算(请仔细推敲) 。 这也是为什么酶切了这段DNA却不影响这几个位点甲基化水平计算的原因 。
故 , 单酶切RRBS数据预处理 , 在去除接头污染之后 , 还要去除:
read1的3'TG
和
read2的5'CA
cutadapt实现:
cutadapt
-aAGATCGGAAGAGC-AAGATCGGAAGAGC
-aTG$-G^CA
-n2
-otrimmed.1.fastq.gz-ptrimmed.2.fastq.gz
reads.1.fastq.gzreads.2.fastq.gz
说明:
小写-a和-g表示切read1接头 , 大写-A和-G表示切read2接头
-a表示切3'接头 , -g表示切5'端接头
-n表示对read最多需要剪切2次
前两个接是illumina通用接头的共同前缀部分 , 红色字体的A正是表示切补平后末端加的A
后面两个是上文说的RRBS需要切掉的碱基 。
双酶切RRBS有的同学可能没听过双酶切RRBS , 说到这个技术小编不免瞬间自豪感爆棚 , 这是易基因现任实验研发部门负责人领衔开发的技术哦!它是一种基于常规RRBS开发的技术 , 相比单酶切RRBS , 能覆盖C位点更多更全面 , 性价比更高!关于双酶切技术的论文可以到本文末尾查看 。
双酶切RRBS采用的是MspI和ApeKI双酶切建库 , 这两种酶的酶切位点如下:
文章图片
文章图片
W表示A或T
我们分析一下整个建库过程中酶切位点周围的碱基变化:
双酶切可切三种片段:
1.单MspI酶切
5'-C|CGG=========C|CGG-3'(W链)3'-GGC|C=========GGC|C-5'(C链)
2.单ApeKI酶切
5'-G|CWGC=========G|CWGC-3'(W链)3'-CGWC|G=========CGWC|G-5'(C链)
3.MspI+ApeKI双酶切
5'-G|CWGC=========C|CGG-3'(W链)3'-CGWC|G=========GGC|C-5'(C链)
4.ApeKI+MspI双酶切
5'-C|CGG=========G|CWGC-3'(W链)3'-GGC|C=========CGWC|G-5'(C链)
不考虑加A的影响 ,
第二种的变化为:
补平:
5'-CWGC=========GCWG-3'(W链)3'-GWCG=========CGWC-5'(C链)
BS转化:
5'-TWGT=========GTWG-3'(BSW链)3'-GWTG=========TGWT-5'(BSC链)
PCR:
5'-TWGT=========GTWG-3'(BSW链)---read13'-AWCA=========CAWC-5'(BSWR链)---read2
+
5'-CWAA=========ACWA-3'(BSCR链)---read23'-GWTG=========TGWT-5'(BSC链)---read1
- 美股同样陷入结构化,100多家市值超百亿美元公司跌入技术性熊市
- 100年后,人类会被消灭?美国这一技术太狠了,俄连夜警告勿玩火
- 虎鲨战机曾被重点关注,整体性能强大,关键技术长期禁售!
- 中国再次突破自我,光伏发电技术,让世界用上1毛钱1度的电
- 解读低配车 实拍最便宜的广汽丰田致炫
- 技术落后的4个汽车品牌,发动机用的还是10年前技术,谁买谁后悔
- 国产OLED屏终于能崛起了!改用新技术:成功解决蒸镀机卡脖子
- 万字解读:销量百万神作《Hades》是如何做战斗系统的?
- 绿色梦想——漫谈摩托车环保技术(上)
- 无视美欧的禁令,向我们提供1500多项关键技术,比俄罗斯还要慷慨
