傻大方


首页 > 知识库 > >

同源性|同源性检测矩阵法的建立及应用( 二 )


按关键词阅读: 应用 建立 矩阵 检测 同源性


最 后将矩阵法运用到逐步搜索过程中 。
为了验证矩阵法在逐步搜索过程中的科学性和合理性 , 在GenBank 中任意选取序列分成两个序列集 , 运用本文提 。

9、出的理 论方法搜索出同源性最高的序列集 , 搜索过程的所有计算通过收稿日期: 2011-07-07;
修回日期: 2011-08-29 基金项目: 江南大学创新团队发展计划资助项目( PIRTJiangnan2008CXTD02)作者简介: 吴艳( 1988-), 女 , 江苏无锡人 , 硕士研究生 , 主要研究方向为生物信息学;
朱平( 1962-), 女 , 安徽巢湖人 , 教授 , 博士 , 主要研究方向VC 6 0 编程完成 , 将所得结果与使用 MEGA 软件的分析结果 进行对比 。
1 理论基础的建立1. 1 检测两序列间同源程度的公式 定义 1 令大小代表了 S 中的 l 条序列与 T 中的 k 条序列的同源程度 。
根据 。

10、以上讨论 , 用 | H | 值的大小来判定这 l + k 条核苷酸序 列的同源性将是非常有意义的 。
命名这种用矩阵来表示一个集合中的每条序列分别与另 一集合中的各条序列的同源性 , 同时赋予矩阵权值 , 用权的大 小来判断两个序列集合的同源性的方法叫做矩阵法 。
20 1HSxTy = in ( Sxnj Tynj ) 2 ( 1)1. 3 逐步搜索n = 1 inj = 1考察核苷酸序列集 S = S1, S2, Sn, T = T1, T2, 称 HSxTy 为两序列间的同源程度 , 其中 n = 1 , 2 , 20;
in = 1 , 2 , 3 , 4 , 5 , 6 。
式( 1) 中 , 右端表示序列 Sx 与 Ty 之间 20 种氨 。

11、基酸各同义 密码子个数的平均差异之和 , 因为氨基酸的种类为 20 , 所以 n 依次取 1 , 2 , 20 , 其中 in 表示第 n 种氨基酸含有同义密码子的种类数( in 可取 1 , 2 , 3 , 4 , 5 , 6)。
Sxnj 的含义是: 序列 Sx 中第Tm, S 由 n 条核苷酸序列组成的集合 , T 是由 m 条核苷酸序列 组成的集合 , ST 。
对于集合 S , 它有 2n 个子集 , 由于空集对问题的讨论无意义 , 故舍去不予考虑 , 用 SP 表示以集合 S 的( 2n 1) 个非空子 集为元素组成的集合 。
S,S,S,S, S,S, S,1 2 n 1 2 1 3n 种氨基酸的第 j 个密码子的个数 , 同理;


12、Tynj 的含义是: 序列 Ty S, S,S, S,S, S,S , S, 1 n2 32 nn 1 n中第 n 种氨基酸的第 j 个密码子的个数 。
氨基酸是生物体不 S, S, S,S, S, S,S, S, S,1 2 31 2 41 2 n 可缺少的营养成分之一 , 它的含量差异可以反映两序列的同源 S, S, S,S, S, S,S, S, S, 程度14 , 所以式( 1) 可以用来衡量两序列的同源性 。
2 3 42 3 52 3 n SP = Sn 2, Sn 1, Sn,S4, S5, Sn 这里规定 , 当 n 分别取 1 , 2 , 20 时 , 依次对应的氨基酸 S 。

13、, S, S,S, S, S , S,1 2n 21 2n 3n 1为: Gly、Glu、Asp、Ala、Val、Arg、Ser、Lys、Asn、Thr、Met、Ile、Gln、 S, S, S , S,1 2n 3 n His、Pro、Leu、Trp、Cys、Tyr、Phe , 所以 in 的取值依次为 4、2、2、4、 S, S, S S, S, S, 3 4n 1 2n 1 4、6、6、2、2、4、1、3、2、2、4、6、1、2、2、2 。
S, S, S,S, S, S 2 3 n 1 2 n1. 2 矩阵法检测多序列同源性当需要特定地判断 S 的某一子集合中的 l 条核苷酸序列同理 。

14、 , 对于集合 T , 用 TP 表示以集合 T 的 ( 2m 1) 个非空 子集为元素组成的集合 。
与 T 的某一子集合中的 k 条核苷酸序列同源性的高低时 , 本文 T,T,T,T, T,T, T,1 2 m 1 2 1 3首先引入一个 l k 的矩阵 H 。
T, T,T, T,T, T,T , T, 1 m2 32 mm 1 mHSx1Ty1HSx1Ty2 HSx1Tyk 1 HSx1Tyk T, T, T,T, T, T,T, T, T,1 2 31 2 41 2 m HSx2Ty1HSx2Ty2 HSx2Tyk 1 HSx2Tyk T2, T3, T4,。

15、T2, T3, T5,T2, T3, Tm, H = TP = Tm 2, Tm 1, Tm,T4, T5, Tm HSxl 1Ty1 HSxl 1Ty2 HSxl 1Tyk 1 HSxl 1TykHSxlTy1HSxlTy2 HSxlTyk 1 HSxlTyk T1, T2, Tm 2,T1, T2, Tm 3, Tm 1,T1, T2, Tm 3, Tm,T3, T4, Tm T1, T2, Tm 1,矩阵的第 i 行 j 列的 HSx y 表示 l 中的第 i 条序列与 k 中第 T, T, T,T, T, T iT j2 3 m 1 2 miT jj 条序列 。

16、的同源性 , HSx y 的值通过式( 1) 计算 , 矩阵的同一行代表了 l 条序列中的某条序列依次与 k 条序列的同源性 , 矩阵的 同一列代表了 k 条序列中的某条序列依次与 l 条序列的同源 性 。
为了在集合 S 中筛选出部分与集合 T 中部分同源性高的 序列 , 本文将采用逐步搜索法 。
算法步骤如下:a) 置初始值 i = 1 , j = 0 。
b) 取步长 k = 1 , j = j + k , j2m 1 , 运用式( 4) 分别比较 SP然后 , 在矩阵 H 中定义一种运算来作为判断 S 中的 l 条核中的 C 1 个含 1 个元素的集合与 TP 中 Cj 个含 j 个元素的集nm苷酸序列与 T 中的 k 条核苷酸序列 。


来源:(未知)

【学习资料】网址:/a/2021/0413/0021925030.html

标题:同源性|同源性检测矩阵法的建立及应用( 二 )


上一篇:银行|银行主管年度工作总结范文

下一篇:合理|合理收取港口岸线使用费