第七章 蛋白质结构预测.ppt
《第七章 蛋白质结构预测.ppt》由会员分享,可在线阅读,更多相关《第七章 蛋白质结构预测.ppt(53页珍藏版)》请在麦多课文档分享上搜索。
1、第七章 蛋白质结构预测,主讲人:孙 啸制作人: 刘志华东南大学 吴健雄实验室,第一节 引言,蛋白质结构预测问题序列结构功能,.-Gly-Ala-Glu-Phe-.,FUNCTION,结构预测问题,.-Gly-Ala-Glu-Phe-.,FUNCTION,解决方法,.-Gly-Ala-Glu-Phe-.,FUNCTION,寻找一种从蛋白质的氨基酸线性序列到蛋白质所有原子三维坐标的一种映射,蛋白质结构预测主要有两大类方法: (1)理论分析方法 通过理论计算(如分子力学、分子动力学计算)进行结构预测。 (2)统计的方法 对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型,进而对未知结构的蛋白质
2、根据映射模型直接从氨基酸序列预测结构。 包括: 经验性方法 结构规律提取方法 同源模型化方法,第二节 蛋白质二级结构预测,蛋白质 序列: 二级结构:,二级结构预测,蛋白质 序列: 二级结构:QLMGERIRARRKKLK STHHHHHHHHHHHHT,1、二级结构预测概述 蛋白质的二级结构预测的基本依据是:每一段相邻的氨基酸残基具有形成一定二级结构的倾向。 二级结构预测问题是模式分类问题 二级结构预测的目标: 判断每一段中心的残基是否处于螺旋、折叠、转角(或其它状态)之一的二级结构态,即三态。,基本策略(1) 相似序列相似结构,QLMGERIRARRKKLK,QLMGAERIRARRKKLK
3、,结构?,基本策略(2) 分类分析,螺旋,提取样本,聚类分析,学习分类规则,预测.-Gly-Ala-Glu-Phe-.,二级结构预测的方法大体分为三代: 第一代是基于单个氨基酸残基统计分析 从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。 第二代预测方法是基于氨基酸片段的统计分析 统计的对象是氨基酸片段 片段的长度通常为11-21 片段体现了中心残基所处的环境 在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据,这些算法可以归为几类:(1)基于统计信息(2)基于物理化学性质(3)基于序列模式(4)基于多层神经网络(5)基于多元统计(6
4、)基于机器学习的专家规则(7)最邻近算法,第一代和第二代预测方法对三态预测的准确率都小于70%,而对折叠预测的准确率仅为2848% 其主要原因是只利用局部信息 第三代方法(考虑多条序列) 运用长程信息和蛋白质序列的进化信息 准确度有了比较大的提高,2、蛋白质二级结构预测方法,经验参数法蛋白质二级结构的组成规律性比较强三种基本二级结构平均占氨基酸残基的85%各种二级结构非均匀地分布在蛋白质中,有些蛋白质中含有大量的螺旋 如血红蛋白和肌红蛋白而一些蛋白质中则不含或者仅含很少的螺旋 如铁氧蛋白有些蛋白质的二级结构以折叠为主 如免疫球蛋白 例:肽链Ala(A)-Glu(E)-Leu(L)-Met(M)
5、 倾向于形成螺旋肽链Pro(P)-Gly(G)-Tyr(Y)-Ser(S)则不会形成螺旋,每种氨基酸出现在各种二级结构中倾向或者频率是不同的 例如:Glu主要出现在螺旋中Asp和Gly主要分布在转角中Pro也常出现在转角中,但是绝不会出现在螺旋中可以根据每种氨基酸残基形成二级结构的倾向性或者统计规律进行二级结构预测,经验参数法由Chou 和Fasman在70年代提出来是一种基于单个氨基酸残基统计的经验预测方法。 通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子,进而利用这些倾向性因子预测蛋白质的二级结构。,一个氨基酸残基的构象倾向性因子定义为Pi = Ai / Ti (i= ,c
6、, t) 式中下标i表示构象态如螺旋、折叠、转角、无规卷曲等; Ti是所有被统计残基处于构象态i的比例; Ai是第A种残基处于构象态i 的比例; Pi大于1.0表示该残基倾向于形成二级结构构象i,小于1.0则表示倾向于形成其它构象。,发现关于二级结构的经验规则基本思想是在序列中寻找规则二级结构的成核位点和终止位点。 扫描输入的氨基酸序列,利用一组规则发现可能成为特定二级结构成核区域的短序列,然后对于成核区域进行扩展,不断扩大成核区域,直到倾向性因子小于1.0为止。 规则: (i)螺旋规则 (ii)折叠规则 (iii)转角规则 (iv) 重叠规则,延伸 成核区 延伸,(i)螺旋规则 沿蛋白质序列
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
2000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 蛋白质 结构 预测 PPT
