- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
三NCBI数据库的数据模型数据库模型:是研究人员输入序列、查询序列、进行序列比对的根本,也是数据库管理人员管理数据的总则。NCBI数据模型包括:序列数据和相关的注释。作用:NCBI模型能轻易地从已公布的DNA序列文献影射到基因所在的染色体--编码蛋白--蛋白质三维结构等。(一)NCBI数据模型的文献1出版物:出版物是连接不同结构和不同内容数据库的桥梁;出版物是数据库记录的基本注释,也是最好的注释,发表文章比数据库中的记录包含了更完整和更详细的信息。2作者数据或文章的作者是系统联系相关数据和科学研究的关键因素;PubMed数据库的作者的输入全称姓和名的首字母3文章最常见的生物科学文献是期刊文献,对于生物数据库的引用格式缺省是期刊文献文章也可出现在书、手稿及电子期刊上。期刊名、年份、文章的首页以及文章作者的姓4.论文标题5Medline和PubMedUIDsPUID和MUID:PubMed唯一识别器和Medline唯一识别器(二)NCBI数据模型的序列1序列识别器(SEQIDS):GenBank、DDBJ和EMBL核酸蛋白数据库共用一套序列号a.Locus名称:兼有唯一辨识器、功能记忆以及序列的组织源等功能;Locus出现在GenBank中的Locus行以及DDBJ记录和EMBL的ID行;GenBank中已不再作为有用的名称,只是为了和老数据格式兼容b.序列号(Accession):GenBank、DDBJ和EMBL具有,以保证序列的相对稳定性和专一性;2个大写字母(分配到不同的数据库)+6个数字c.gi号(GeneInfo,GI)gi:基因信息号,核酸序列和蛋白质序列均有gi号;gi的来源:由源数据库提供;序列仅当其完整地被提交公共数据库处理后,才最终达到一个序列号和一个gi号;位置:在VERSION行中,版本号,gi号修改记录时,新记录与原先记录不同时(哪怕是一个碱基不同),产生新的gi号,但序列号不变;2生物序列(BIOSEQ)生物序列:一个简单的、连续的核酸或蛋白质分子至少有一个序列辨识器包含DNA、RNA或蛋白质分子的物理信息、注释信息(如特定区域的生物特征)和描述信息(如该分子是从某个组织中获得的)第六节蛋白质数据分析由于传统的用X光晶体衍射和核磁共振技术测定蛋白质的三维结构、用生化方法研究蛋白质功能的效率不高,无法适应由基因组测序所带来的蛋白质序列数量快速增长的需要,近年来,许多科学家致力于用理论计算的方法预测蛋白质的三维结构,提高蛋白质功能研究的效率,并取得了一些的成果,但总体效果并不理想。一、蛋白质基本性质分析蛋白质序列分析的基本方面:包括分析蛋白质的氨基酸组成、相对分子质量、等电点、亲水性、疏水性、消光系数、信号肽等在一些蛋白质数据库如UniProt等可查询到已收录序列的基本理化特征对于新得到的蛋白质序列,可通过蛋白质序列分析专家系统ExPASy(ExpertProteinAnalysisSystem)服务系统的蛋白组学工具软件如ProtParam、ProScale和ComputepI/Mw等软件进行分析(http://www.expasy.ch/tools/)二、蛋白质功能预测与分类InterPro数据库与蛋白质功能预测与分类COG、GO对蛋白质功能的分类KEGG对蛋白质的代谢途径分析InterPro数据库与蛋白质功能的预测、分类DatabaseLocationPROSITESwissInstituteofBioinformatics(SIB),Geneva,SwitzerlandHAMAPSwissInstituteofBioinformatics,Geneva,SwitzerlandPfamWellcomeTrustSangerInstitute,Hinxton,UKPRINTSUniversityofManchester,UKSUPERFAMILYUniversityofBristol,UKCATH-Gene3DUniversityCollege,London,UKProDomPRABIVilleurbanne,FranceSMARTHeidelberg,GermanyTIGRFAMsJ.CraigVenterInstitute,Rockville,MD,
文档评论(0)