- 1、本文档共65页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
摘要
多功能酶是具有可以催化多种基本化学反应的一种特殊类型的酶。研究表明,多功
能酶可以以不同的形式来催化不同的化学反应,这使得多功能酶的研究价值和使用价值
都要高于普通的单功能酶。传统的酶功能研究方法大都采用酶分析这一类的生物实验技
术,对于多功能酶的分类以及数量快速增长的新酶的功能测定来说,基于生物技术的方
法就显得十分耗时和代价昂贵。为应对上述挑战,近年来人们开始尝试借助机器学习等
计算方法来处理酶功能分类问题。多功能酶预测问题本质上是一个多标签分类问题,目
前已提出一些基于机器学习的多功能酶分类预测方法,且显示出了一定的有效性,但仍
存在如下两个方面的重要挑战:一方面,已有方法几乎都只主要考虑了酶的序列特征,
对于类别的标签特征并没有充分利用;另一方面,已有的多功能酶预测方法大多只考虑
了多功能酶的主要类别的预测,而未能实现多功能酶完整EC编码的预测。针对上述挑
战,本文进行了深入研究,提出了两种新的多功能酶分类预测模型。具体地,本文主要
工作可概述如下:
(1)为充分利用酶类别的标签语义特征以及充分预测多功能酶的完整EC编码,提
出了一种融合序列和多标签嵌入信息的多视角深度学习多功能酶预测方法mlDGCnet
(Multi-labelDeeplearningGCN-CNNnet)。该方法引入了多视角学习、多标签分类机制
和图卷积深度学习网络结构,通过提取酶序列的序列相关性特征和序列无关特征构建多
视角特征集;同时使用图卷积网络对酶分类标签信息进行深度特征提取,并用于指导多
视角学习过程;最终通过多标签分类器对多功能酶进行分类预测。相比于大部分现有的
基于深度学习的多功能酶分类预测方法,本文提出的方法在多功能酶的各层EC码预测
性能上均得到了一定提升。
(2)上述的多功能酶分类预测方法mlDGCnet虽然取得了较好的预测性能,但其
在对酶序列进行提取特征时,学习的都是酶序列的局部特征。由于蛋白质的功能通常与
其整体结构密切相关,因而,仅使用序列的局部特征很难获取有效的酶的整体结构和功
能信息。另外,酶序列的局部特征的分布可能受到酶结构的变化影响,即酶在结构上的
变化可能导致不同的局部特征分布,使得仅仅依赖局部特征难以实现酶功能的准确分类。
针对此,在本文提出的mlDGCnet方法的基础上,对mlDGCnet中用于序列深度特征提
取的CNN-BiLSTM模块进行改进,提出了一种融合局部和全局序列特征的多视角深度
学习多功能酶分类预测方法mlCBiGCnet。在该方法的序列特征提取部分,使用了带多
头注意力机制的CNN-BiGRUs混合网络来对序列的深度局部特征和深度全局特征进行
提取,以更好地捕捉多功能酶序列的整体结构信息,从而在一定程度上进一步提升模型
的预测性能。实验结果表明,相比于上一个工作中的mlDGCnet方法,mlCBiGCnet在
EC编码每一层的预测性能又有了一定提升。
关键词:多功能酶分类,多视角深度特征学习,多标记信息辅助的特征学习,多标签分
类,全局和局部特征
I
Abstract
Abstract
Amultifunctionalenzymeisaspecialtypeofenzymethatcatalyzesavarietyofbasic
chemicalreactions.Studieshaveshownthatmultifunctionalenzymescancatalyzedifferent
chemicalreactionsindifferentforms,whichmakestheresearchvalueandapplicationvalue
ofmultifunctionalenzymeshigherthanthatofordinarysingle-functionenzymes.Traditional
methodsofenzymefunctionresearchmostlyusebiolo
文档评论(0)