『易坊知识库摘要_同源性|同源性检测矩阵法的建立及应用( 三 )』17、的同源性的标准 。 合的 | H |, 最大值为 | H |max1 , 构成它的集合为 N1。 m定义 2 令c) 取步长 p = 1 , i = i + p , i2n 1 , 转步骤 b), 分别比较 SPC = HSx...
按关键词阅读: 应用 建立 矩阵 检测 同源性
17、的同源性的标准 。
合的 | H |, 最大值为 | H |max1 , 构成它的集合为 N1。
m定义 2 令c) 取步长 p = 1 , i = i + p , i2n 1 , 转步骤 b), 分别比较 SPC = HSx1Ty1 HSx2Ty1 + HSx2Ty1 HSx3Ty1 + +中的 C i 个含 i 个元素的集合与 TP 中 Cj 个含 j 个元素的集合HSxl 1Ty1 HSxlTy1( 2)的 | H |, 最大值为 | H |maxi , 构成它的集合记为 Ni。
nR = HSx1Ty1 HSx1Ty2 + HSx1Ty2 HSx1Ty3 + +d) 将所得的 | H |max1 , | H |m 。
18、ax2 , | H |max( 2 n 1)依次比较 , 若HSx1Tyk 1 HSx1Tyk( 3)| H |max | H |max( i + 1) , 比 较 | H |maxi、| H |max( i + 2) , 否 则 , 比 较A = HSx1Ty1 + HSx1Ty2 + + HSx1Tyk + HSx2Ty1 + HSx2Ty2 + +| H |max( i + 1)、| H |max( i + 2) , 最终得到一个最大值 | H |max , 构成它HSx2Tyk + + HSxl 1Ty1 + HSxl 1Ty2 + + HSxl 1Tyk +HSxlTy1 + HSxlTy2 + + HSxlT 。
19、yk( 4)的集合为 N ( 1 , 2 , 3 , 2n 1 )。
N2 矩阵法的验证与应用即为搜索结果 。
称 H = C + R + A 为矩阵 H 的权 。
其中 , C 的大小体现了S 中 l 条核苷酸序列的整体同源程度 , R 的大小体现了 T 中 k条核苷酸序列的整体同源程度 , A 为 H 中所有元素之和 , 它的为了验证本文所述矩阵法在逐步搜索过程中的科学性与 合理性 , 建立完上述理论基础后 , 将其运用于实例分析中 。
续表 1氨基酸S1S2S3S4S5S6T1T2T3T4cca9179111099101324ccc203919525419251316ccu8238991891722Leucug617611111161 。
20、2742cua12612516131215918cuc122412120512201321cuu724771617161924uug21729211222743uua51456105591734Trpugg81581613108131658Cysugc10201041361013953ugu5225467562130Tyruac8781110148101229uau81281913892930Pheuuc62566711681737uuu8448598893560STOPuga0200900001948uag060200001121uaa02305100113342. 1 数据来源在 GenB 。
21、ank 中任意选取 10 条核苷酸序列 , 登录号依次为: AF091500、NM001130714、AF091497、FR749942、AB600229、 CY090832、AF091499、AB600228、NC010439、HQ655820 , 将这些 序列分为个数不等的两个集合 , 并给每条序列取一代号 。
集 合 S 由以下六条序列构 成: AF091500 ( S1 ) 、NM001130714( S2 ) 、AF091497 ( S3 ) 、FR749942 ( S4 ) 、AB600229 ( S5 ) 、CY090832( S6 ), 记 S = S1, S2, S3, S4, S5 、S6 。
22、, 则集合 S 有 63 个非空子集合 。
集合 T 由以下四条序列构成: AF091499 ( T1 ) 、AB600228 ( T2 ) 、NC010439 ( T3 ) 、HQ655820 ( T4 ), 记 T = T1, T2, T3, T4, 则 T 有 15 个非空子集合 。
2. 2 各序列每种密码子个数运 用 网 站 http: / / mobyle pasteur fr / cgi-bin / portal py? form = codonw 可以得到每条序列各种密码子的个数 , 统计结果 如表 1 所示 。
表 1 各序列每种密码子个数氨基酸 S1S2S3S4S5S6T1 T2 T3 T 。
23、4Gly ggg 1 16 1 18 3 14 1 2 14 44 gga 4 22 5 11 11 13 5 12 13 43 ggc 2 23 2 12 8 5 2 8 7 52 ggu 4 14 3 23 3 8 3 3 8 33Glu gag 1 32 1 15 6 10 1 6 11 21 gaa 2 19 2 12 4 24 2 4 12 34Asp gac6 8 6 8 8 13 6 8 7 222. 3 两两序列间的同源程度基于式( 1), 通过 VC 6 0 编辑程序 , 得到 S 中的六条序列 分别与 T 中的四条序列的同源程度 , 如表 2 所示 。
表 2 集合 S 中的各条序列与 。
24、 T 中的各条序列的同源性分析序列 S1S2S3S4S5S6Tgau4124 8 6 11 4 6 23 27T2 250 83 3567 58 244 083 7 5 2 3 5 5 700 16 4 18 0 4 10 37 T3 3424 5 2617 92 3427 5810 10 16 9 10 16 9 24 T4 23104 58 10923 67 23100 672 7 5 5 2 5 11 40 由表中数据可知 , S1 与 T1 、0 10 3 7 1 3 17 29 同源程度相对于其他两两序列1 5 2 17 1 2 14 30Alagcg321gca023gcc1028gc 。
25、u216Valgug013gua18guc813951668161127但至此还没有在 S 与 T 中guu685757552135分 , 下面将进行逐步搜索过程 。
Argagg01801104001137aga016010313031333cgg031080000837再次运用 VC 6 0 编辑程序cga2172760261145个非空子集分别与 T 中的各个11 9174865 171865 5245 921597 67852 083 831347 082915 0826341952 4219200 67 19790 0817189 83T2, S3 与 T1 、T2, S5 与 T1 、T2 。
26、 的 间而言是比较高的 。
确切地筛选出同源性最高的部cgc2 16 2 10 4 0 2 4 6 582. 4 逐步搜索过程进行逐步搜索 , 得到 S 中的各 非空子集的同源程度 。
介于篇cgu1 8 1 9 2 0 1 2 16 41Ser agc 7 32 7 9 8 8 7 8 4 34 agu 1 9 1 8 1 6 1 1 12 25 ucg 1 6 1 4 4 1 1 3 11 37 uca 10 11 10 7 12 17 10 13 4 28 ucc 15 35 16 6 20 4 16 20 10 25 ucu 8 28 8 6 10 9 8 10 16 33Lys aag 3 21 。
27、 3 11 5 15 3 5 29 45 aaa 6 38 6 9 10 27 6 10 19 68Asn aac 5 19 5 8 9 15 5 10 11 32 aau 8 11 8 8 12 28 8 11 29 51Thr acg 1 6 1 10 1 3 1 1 6 27 aca 2 28 2 5 2 23 2 2 13 21 acc 9 14 9 11 12 2 10 12 4 23acu7 16 7 6 10 10 6 10 21 17幅有限 , 这里只列出与矩阵法最终搜索出的序列相关的数据 , 如表 3 所示 。
T1T1、T2T2、T4T1、T3、T4494 671242 3389594 。
28、 8299078 75T2T1、T3T3、T4T2、T3、T4745 7413403 3495958 1599080 90表 3 矩阵法的逐步搜索结果S1、S3、S5T3 T1、T4T1、T2、T3T1、T2、T3、T410282 74 89592 67 13902 08 99577 48T4 T2、T3T1、T2、T469309 83 13405 49 90091 41 在整个搜索过程中 , 发现针对 SP 的单元素集合 , 若考察TP 的单元素集合 , S 与 T 的同源程度最小 , 其 | H | 的值为 1;
来源:(未知)
【学习资料】网址:/a/2021/0413/0021925030.html
标题:同源性|同源性检测矩阵法的建立及应用( 三 )