- 1、本文档共21页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
序列比对课件.ppt
序列比对 概念 意义 理论基础 方法 显著性检验 概念 通过比较生物分子序列,发现它们的相似性,找出序列之间共同的区域,同时辨别序列之间的差异,从而揭示生物序列的功能、结构和进化的信息。 什么是生物序列? 生物序列一般指DNA、RNA或者蛋白质序列,比较不同类型的生物体序列的相互关系是生物序列分析的核心问题。 意义 最常见的比对是蛋白质序列之间或核酸序列之间的两两比对,通过比较两条序列之间的相似区域和保守性位点,寻找二者可能的分子进化关系。还可以对多条蛋白质或核酸序列同时进行比较,寻找这些有进化关系的序列之间共同的保守区域、位点,从而探索导致它们产生共同功能的序列模式。此外,还可以通过比较蛋白质序列与核酸序列来探索核酸序列可能的表达框架;把蛋白质序列与已知三维结构信息的蛋白质相比,从而获得蛋白质折叠类别的信息。近年来随着生物信息学数据大量积累和生物学知识的整理,通过比对方法可以有效地分析和预测一些新发现基因的功能。 理论基础 进化学说 地球上现存物种都是曾经生存的物种的后代,渊源于共同的祖先。 生存斗争和自然选择。 适应是自然选择的产物。 同源:如果两条或多条序列拥有共同祖先,则称它们同源。 相似:两条序列的相似的程度。 一般来说,相似性很高的两条序列之间往往具有同源关系。但也会有例外,即两条序列相似性很高,由于随机因素进化趋同,而称这样的序列为同功序列,常见于蛋白质序列。 如果两个序列之间相似性很高,就可以推测二者在进化上可能有共同的祖先,经序列内残基的替换、残基或序列片段的缺失,以及序列重组等遗传变异过程分别演化而来。 在残基-残基比对中,可以明显地看到序列中某些氨基酸残基比其他位置上的残基更保守,这些信息揭示了这些保守位点上的残基对蛋白质的结构和功能是至关重要的。但并不是所有保守的残基都一定是结构功能重要的,可能它们只是由于历史的原因被保留下来,而不是由于进化压力而保留下来。序列比对可以发现隐含在生物序列中的功能、结构及进化的信息。 方法 序列比对是在两条或多条序列中寻找按照相同次序排布的一连串的单个字符或字符模块的过程。在进行两条序列比对时,将两个序列写成两行;相同或者相似的字符置于同一列,不同的字符要么置于同一列作为一个错配,要么对应于另一个序列上一个空位。 两条序列比对 全局比对 对序列从头到尾进行比较。试图使尽可能的字符在同一列中匹配。全局比对适用于相似度较高且长度相近的序列。 局部比对 寻找序列中相似度最高的区域,也就是匹配密度最高的部分。局部比对适用于某些部位相似度较高,而其他部位差异较大的序列。 方法 点阵分析法 点阵法能将所有可能的比对结果用该矩阵的对角线表现出来,还能显示插入、缺失及序列内部正向和反向重复的存在,这是其他方法很难做到的。 动态规划算法 Needleman-Wunsch算法,Smith-Waterman算法 Blast方法 Blast程序在进行序列数据库相似性搜索时,查询序列可选择过滤掉低复杂度的区域,然后按字长参数(DNA序列一般为11,蛋白质序列为3)将序列分解成小的字串。找出查询序列和目标序列间所有单个或多个连续匹配的字串。对于这样的局部对比排列,可用打分函数或记分矩阵进行打分,这个得分就是序列相似性的度量,不同的匹配程度得分有高低之分。若匹配程度较高,且记分超过一定阈值的连续字串就被称为序列片段对(segment pair),它是两条给定序列中的一对子序列,它们的长度相等,且形成无空位的完全匹配。 找到序列片段对后,再对具有一定长度的片段对沿序列的两个方向来扩展一个对位排列,只要记分值不断增加就持续下去。当累积记分停止增加时,就停止向两个方向的扩展。由此得到一定长度的保持最好记分的序列串,称为高记分片段对(high-scoring pair,HSP)。 接下来就是检查发现的每个HSP值是否大于阈值,经鉴定后列出整个数据库中匹配的高记分片段对。 算法的改进: 允许空位 最初的Blast程序不允许空位插入,但在生物的进化过程中碱基的插入或缺失突变时普遍存在的,因此比对结果通常会出现一些无空位但不连续的区域,若将有些高分值片段对通过一些相似性较低且有空位的片段连接起来,就能组成一些更长的或许更具实际生物学意义的比对。Altshul改进了Blast算法,允许插入删除操作。 结合动态规划的方法 加入空位字符后会影响搜索速度,为此改进后的算法缩短了对数据库初始搜索的时间,在多个HSP中,只找出一个最好的得分最高的片段对(maxmal segment pair,MSP),并以此为基础运用动态规划方法将这一片段向序列两端延伸,最终产生一个记分较高的最佳对比结果,且可能有空位插入。 通过计算相似性打分所识别的序列
您可能关注的文档
最近下载
- FLEX SYSTEM EN2092 1GB ETHERNET调试文档模板.pdf VIP
- 2024年9月中国汽车产销报告.pdf VIP
- 2024年11月广东深圳市福田区选用机关事业单位辅助人员和社区专职工作者143人笔试备考题库及答案解析.docx VIP
- 流体力学 课件 第6章 气体射流.pptx
- 武汉理工大学材料科学基础课件(全套).pdf
- 风貌改造工程施工组织设计.doc
- 药品生物检定技术 全套教案.doc
- 浅谈双碳战略下的自来水厂碳核算碳减排经验分享_供水技术讲座资料课件.pptx
- 2024广州铁路局机考.pdf
- 11《动物的眼睛》教学设计-2023-2024学年科学二年级下册青岛版.docx VIP
文档评论(0)