基因家族分析.pptx

  1. 1、本文档共58页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基因家族分析

——挖掘与物种特性相关的生物学问题

张龙

华中农业大学广东省农科院

2539570165@qq.cm;

基本内容;

一、获取目标物种基因;

二、目标物种基因基本信息的获取(命名、理化性质、亚细胞定位等)

●蛋白物理化学性质分析

/protparam/

●亚细胞定位ttp:///bioinf/plant-

multi/#;

三、构建系统发育树——构建、评估、解读

1、构建

·序列比对,选择保守区域

·有根树or无根树:一般由于信息不足,采用无根树

·建树方法的选择:NJ法(常用,远缘)、ML法(进化模型)、MP法(近缘)等

2、评估

自展检验(Bootstrapmethod)法,检验次数一般1000次,可将分支上的百分数视为这支结果的可信度。;

三、构建系统发育树——构建、评估、解读

3、解读;

四、染色体定位分析

1、基因主要分布于哪条染色体?

2、是否能形成基因簇?基因簇的形成一般与基因家族的来源和特定功能有关。;

五、motif分析(保守基序分析)

在文章中,motif分布图通常与基因家族进化树合并,这样有助于直

观查看不同分支保守和特异性motif。如果对某些motif感兴趣,还可进一步用CDD注释motif功能。可见每一推测同一亚家族成员有类似的功能;

六、基因结构分析

了解基因家族成员的基本分类信息、提供对某些基因家族内进化关系的见解。在文章中,基因结构图通常与基因家族进化树合并,这样有助于直观查看不同分支在基因结构上的保守性和特征。;

七、基因复制和共线性分析

阐明目标物种基因家族的潜在进化机制,有无串联重复和大片段复制。研究目标物种和其他物种基因家族成员之间的直系同源对关系。;

红色:高表达

蓝色:低表达

一般有以下几种类型:

·不同组织表达分析:根、茎、叶

·不同时间表达分析:1d、2d、3d

·不同处理表达分析:干旱、盐碱、水渍明确基因家族的表达情况;

九、启动子分析

获得基因家族功能相关的上游调控通路或因子,或响应的上游信号。;

十、其他分析

1、蛋白互作网络分析:

·分析家族成员之间的蛋白互作情况,分析是否需要形成同源或异源二聚体或多聚体来发挥功能???

·目标基因家族蛋白发挥作用时是否需要和其他蛋白形成复合体;

·分析目标基因家族蛋白的上下游互作调控蛋白,比如转录因子通过结合基因启动子来调控基因表达,或者激酶通过蛋白互作磷酸化该蛋白从而进行信号转导;

·可以靶向下游基因发挥作用,比如酶催化底物蛋白进行生化反应等

2、蛋白domian比对分析和可视化

3、蛋白3D结构分析和可视化

4、基因家族特殊结构域分析;

基因家族分析简明教程;

1、获取目标物种基因

2、目标物种目标基因家族鉴定

3、基因家族成员理化性质分析

4、亚细胞定位预测

5、染色体定位分析

6、系统进化分析

7、基因结构分析

8、motif分析

9、启动子分析

10、基因共线性分析

11、其他分析;

1.基因家族的鉴定

·1.1获取参考基因组信息NCBI();

1.2获取目标物种相关基因组数据(DNA,cDNA,CDS,Protein

sequence,Genesets(GTFGFF3)等)——使用EnsemblPlants数据库

http://plants.ensembl.org/info/data/ftp/index.html

;

2基因家族成员鉴定:hummer鉴定

在Pfam网站https:///下载隐马尔可夫模型;

2.2在Pfam网站/下载隐马尔可夫模型;

2.3以下载好的HMM模型向目标物种基因组序列(蛋白)搜索,以筛选得到大致的基因家族成员(候选基因)。

hmmer程序/下的子程序hmmsearch;

2.4.1将候选基因提交到NCBI中的BatchCDD

search和Pfam数据库比对,验证是否具有目标基因特征,删除假阳性基因。首先是BatchCDDsearch。

·打开NCBI——CDD——batch—CD—search

·输入刚刚提取得到的蛋白序列,点击Browseresult,全选序列:

;

2.4.2再点击showselectedqueries,查看蛋白结构域将不含有目的基因家族结构域的蛋白删除,最后得到的蛋白序列即为该基因家族的序列。或者使用TBtools中的VisualizeNCBICDDDomain

Pattern可视化结构域图。;

2.5.1Pfam数据库验证比对(http://pfam-/search);

2.5.

文档评论(0)

gondolaaaa + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档