南方医科大学基础医学生物信息学重点.docxVIP

下载本文档

0
0
约6.79千字
约 6页
2023-11-06 发布于北京
举报
版权申诉

南方医科大学基础医学生物信息学重点.docx

1、本文档共6页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Made by Kim 2008 级基础医学 1在进行序列局部比对的时候，能不能在同一位置插入双 gap ?为什么？不能，因为如果能在同一位置插入双 gap的话，就能在两条序列的任何位置插入双 gap，得出的对比结果都是一样的，没有统计学意义。 2解释生物信息名词 BLAST CDS（ GBFF格式中的特性关键词）、NCBI、UPGMA EBI。 BLAST： Basic Local Alignment Search Tool 基本局部相似性对比搜索工具； CDS : Coding sequenee 蛋白编码区信息； NCBI : National Center of Biotechnology Information 美国国立生物技术信息中心； UPGMA unweighted pair group method with arithmetic mean 非加权算术平均组对法； EBI : European Bioinformatics Institute 欧洲生物信息学中心。 3 NCBI 的 BLAST工具有 5 个基本程序，分别为 nueleotide blast ，protein blast ，blastx ， tblastn ，tblastx ，请分别说明每个程序解决的问题。 Blast n:用核酸序列搜索核算数据库； Blastp:用蛋白质序列搜索蛋白质数据库； Blastx :用核酸序列搜索蛋白质数据可库（先将核酸序列按 6个可读框翻译成蛋白质序列）； Tblastn :用蛋白质序列搜索核算数据库（先将核酸数据库的序列按 6个可读框翻译成蛋白质序列）； Tblastx:将查询序列和数据库里的核酸序列都按 6个可读框翻译成蛋白质序列再对比，每两条序列进行36次对比。 4如果我们想知道一个基因组 DNA数据库中是否有某个蛋白的直系同源物，该采用什么样的序列分析工具。采用tblastn 序列分析工具。 5通过BLAST比对，发现两个序列相似度是 90%能不能认定两个序列同源性是 90%为什么。不能，因为同源性是序列同源或者不同源的一种论断，而相似性或者一致性是一个序列相关性的量化，是两个不同的概念。 5在NCBI中检索的时候，在检索框中输入“ AAO41714[ACCN”能返回一个怎样的结果？返回唯一一条序列号为 AA41714的相关信息。 6对核酸序列进行 BLAST的时候，选择的字（WORD越长精度越高还是越短精度越高，为什么？搜索速度跟字长有什么关系？字越长精度越高。因为blast程序在进行序列数据库相似性搜索时，查询序列可选择过滤掉低复杂度的区域，然后按字长参数（ DNA序列一般为11,蛋白质一般为3）将序列分解成小的字串。然后程序再找出查询序列和目标序列间所有单个或多个连续匹配的字串。字串越长，所要求匹配的序列越长，所要求序列的匹配度越高，所以越精确。增加字长可以提高搜索的特异性和速度。 7这是某蛋白质的一个 pattern : GXW[YF][EA][IVLM]，请说明其含义。 Gly-a ny-Trp-[Tyr or Phe]-[Glu or Ala]-[lle or Vai or Leu or Met] PA [AC]-x-V-x(4)-{ED} : [Ala or Cys]-any-Val-any-any-any-any-{any but Glu or Asp} PA <A-x-[ST](2)-x(0,1)-V. Ala-a ny-[Ser or Thr]-[Ser or Thr]-(a ny or non e)-Val 8简单介绍NCBI Referenee Sequences 数据库(其他上课讲过的如 PROSITE数据库等 ) The Refere nee Seque nee (RefSeq) collect ion aims to provide a comprehe nsive, integrated, non-redundant, well-annotated set of sequences, including genomic DNA, tran scripts, and prote ins. RefSeq is a foun dati on for medical, function al, and diversity studies; they provide a stable reference for genome anno tatio n, gene iden tificati on and characterizati on, mutati on and polymorphism an alysis (especially Ref