技术解读|RRBS测序中因酶切人为引入碱基问题单酶切RRBS双酶切RRBS( 二 )


同样 , 人工加入的序列有:
read1的:3'TWG
read2的:5'CWA和3'CWA
但是由于read2的3'CWA是原始非人工序列互补而来的 , 所以它不影响原始W和C链5'CWG中C碱基甲基化水平的计算 。
所以需要去除的序列是:
read1的:3'TWG
read2的:5'CWA
第三种的变化为:
补平:
5'-CWGC=========CCG-3'(W链)3'-GWCG=========GGC-5'(C链)
BS转化:
5'-TWGT=========TTG-3'(BSW链)3'-GWTG=========GGT-5'(BSC链)
PCR:
5'-TWGT=========TTG-3'(BSW链)---read13'-AWCA=========AAC-5'(BSWR链)---read2
+
5'-CWAC=========CCA-3'(BSCR链)---read23'-GWTG=========GGT-5'(BSC链)---read1
同样 , 人工加入的序列有:
read1的:3'TG和3'TWG
技术解读|RRBS测序中因酶切人为引入碱基问题单酶切RRBS双酶切RRBS】read2的:5'CWA和CA , 3'CWA和CA
但是由于read2的3'CWA和3'CA不影响原始W链5'CWG和C链5'CG中C碱基甲基化水平的计算 。
所以需要去除的序列是:
read1的:3'TG和3'TWG
read2的:5'CWA和5'CA
第四种PCR后得到的序列为:
5'-TGG=========GTWG-3'(BSW链)---read13'-ACC=========CAWC-5'(BSWR链)---read2
+
5'-CAA=========ACWA-3'(BSCR链)---read23'-GTT=========TGWT-5'(BSC链)---read1
同样 , 人工加入的序列有:
read1的:3'TG和3'TWG
read2的:5'CWA和CA , 3'CWA和CA
但是由于read2的3'CWA和3'CA不影响原始W链5'CWG和C链5'CG中C碱基甲基化水平的计算 。
所以需要去除的序列是:
read1的:3'TG和3'TWG
read2的:5'CWA和5'CA
总结以上分析结果 , 得出结论:
双酶切RRBS需要去除的序列是:
read1的:3'TG和3'TWG
read2的:5'CWA和5'CA
cutadapt实现:
cutadapt
-aAGATCGGAAGAGC-AAGATCGGAAGAGC
-aTG$-aTAG$-aTTG$
-G^CA-G^CAA-G^CTA
-n2
-otrimmed.1.fastq.gz-ptrimmed.2.fastq.gz
reads.1.fastq.gzreads.2.fastq.gz
说明:
小写-a和-g表示切read1接头 , 大写-A和-G表示切read2接头
-a表示切3'接头 , -g表示切5'端接头
-n表示对read最多需要剪切2次
前两个接是illumina通用接头的共同前缀部分 , 红色字体的A正是表示切补平后末端加的A
后面一个是上文说的双酶切RRBS需要切掉的碱基 , 每一行所列要切的序列之间是“或”的关系 , 故最多切2次 , n设置为2 。
双酶切RRBS技术论文:Wangetal.BMCGenomics2013,14:11http://www.biomedcentral.com/1471-2164/14/11