- 1、本文档共58页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
基因家族分析
——挖掘与物种特性相关的生物学问题
张龙
华中农业大学广东省农科院
2539570165@qq.cm;
基本内容;
一、获取目标物种基因;
二、目标物种基因基本信息的获取(命名、理化性质、亚细胞定位等)
●蛋白物理化学性质分析
/protparam/
●亚细胞定位ttp:///bioinf/plant-
multi/#;
三、构建系统发育树——构建、评估、解读
1、构建
·序列比对,选择保守区域
·有根树or无根树:一般由于信息不足,采用无根树
·建树方法的选择:NJ法(常用,远缘)、ML法(进化模型)、MP法(近缘)等
2、评估
自展检验(Bootstrapmethod)法,检验次数一般1000次,可将分支上的百分数视为这支结果的可信度。;
三、构建系统发育树——构建、评估、解读
3、解读;
四、染色体定位分析
1、基因主要分布于哪条染色体?
2、是否能形成基因簇?基因簇的形成一般与基因家族的来源和特定功能有关。;
五、motif分析(保守基序分析)
在文章中,motif分布图通常与基因家族进化树合并,这样有助于直
观查看不同分支保守和特异性motif。如果对某些motif感兴趣,还可进一步用CDD注释motif功能。可见每一推测同一亚家族成员有类似的功能;
六、基因结构分析
了解基因家族成员的基本分类信息、提供对某些基因家族内进化关系的见解。在文章中,基因结构图通常与基因家族进化树合并,这样有助于直观查看不同分支在基因结构上的保守性和特征。;
七、基因复制和共线性分析
阐明目标物种基因家族的潜在进化机制,有无串联重复和大片段复制。研究目标物种和其他物种基因家族成员之间的直系同源对关系。;
红色:高表达
蓝色:低表达
一般有以下几种类型:
·不同组织表达分析:根、茎、叶
·不同时间表达分析:1d、2d、3d
·不同处理表达分析:干旱、盐碱、水渍明确基因家族的表达情况;
九、启动子分析
获得基因家族功能相关的上游调控通路或因子,或响应的上游信号。;
十、其他分析
1、蛋白互作网络分析:
·分析家族成员之间的蛋白互作情况,分析是否需要形成同源或异源二聚体或多聚体来发挥功能???
·目标基因家族蛋白发挥作用时是否需要和其他蛋白形成复合体;
·分析目标基因家族蛋白的上下游互作调控蛋白,比如转录因子通过结合基因启动子来调控基因表达,或者激酶通过蛋白互作磷酸化该蛋白从而进行信号转导;
·可以靶向下游基因发挥作用,比如酶催化底物蛋白进行生化反应等
2、蛋白domian比对分析和可视化
3、蛋白3D结构分析和可视化
4、基因家族特殊结构域分析;
基因家族分析简明教程;
1、获取目标物种基因
2、目标物种目标基因家族鉴定
3、基因家族成员理化性质分析
4、亚细胞定位预测
5、染色体定位分析
6、系统进化分析
7、基因结构分析
8、motif分析
9、启动子分析
10、基因共线性分析
11、其他分析;
1.基因家族的鉴定
·1.1获取参考基因组信息NCBI();
1.2获取目标物种相关基因组数据(DNA,cDNA,CDS,Protein
sequence,Genesets(GTFGFF3)等)——使用EnsemblPlants数据库
http://plants.ensembl.org/info/data/ftp/index.html
;
2基因家族成员鉴定:hummer鉴定
在Pfam网站https:///下载隐马尔可夫模型;
2.2在Pfam网站/下载隐马尔可夫模型;
2.3以下载好的HMM模型向目标物种基因组序列(蛋白)搜索,以筛选得到大致的基因家族成员(候选基因)。
hmmer程序/下的子程序hmmsearch;
2.4.1将候选基因提交到NCBI中的BatchCDD
search和Pfam数据库比对,验证是否具有目标基因特征,删除假阳性基因。首先是BatchCDDsearch。
·打开NCBI——CDD——batch—CD—search
·输入刚刚提取得到的蛋白序列,点击Browseresult,全选序列:
;
2.4.2再点击showselectedqueries,查看蛋白结构域将不含有目的基因家族结构域的蛋白删除,最后得到的蛋白序列即为该基因家族的序列。或者使用TBtools中的VisualizeNCBICDDDomain
Pattern可视化结构域图。;
2.5.1Pfam数据库验证比对(http://pfam-/search);
2.5.
您可能关注的文档
- 任务调度系统之XXL-JOB分享(1).pptx
- Excel 2016数据处理与分析(微课版)PPT完整全套教学课件(293页).pptx
- 故事绘本羲和浴日.pptx
- 2014造口治疗师培训个案发展计划及产品册失禁.docx
- 2014造口治疗师培训个案发展计划及产品册伤口.docx
- 党建联系点制度.docx
- 2024-2030年全球及中国自行车码表行业市场现状供需分析及市场深度研究发展前景及规划可行性分析研究报告.docx
- 人工智能应用2024年人工智能应用的新领域.pptx
- 《煤矿开采学》课程设计说明书.docx
- 实验室试剂管理培训.pptx
- 2021-2022学年湖南省常德市安乡县四年级上学期期中语文真题及答案.pdf
- 2023-2024学年河南省南阳市社旗县四年级上学期期中数学真题及答案.pdf
- 2022-2023学年云南省曲靖市四年级下学期期末数学真题及答案.pdf
- 2021-2022学年河南省周口市鹿邑县二年级下册月考语文真题及答案.pdf
- 2018年河南焦作解放区教师招聘考试真题及答案.pdf
- 2019年江西公务员行测考试真题及答案-乡镇.pdf
- 2019中国石油报社应届高校毕业生招聘试题及答案解析.pdf
- 光大银行招聘应届毕业生能力素质测试笔试真题及答案.pdf
- 2024年广西百色教师招聘考试模拟题及答案.pdf
- 2021-2022学年浙江绍兴诸暨市五年级上册语文期末试卷及答案.pdf
文档评论(0)