AI蛋白质行业研究报告.docx

  1. 1、本文档共45页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

3

3

1

1.1

1.2

1.2.1

1.2.1

1.2.2

1.2.2

1.2.3

1.2.3

8

8

2.1

2.1.1

2.1.1

2.1.2

2.1.2

序号

时间

模型

发表期刊

架构

缺点

1

1980s

BlastKNN

/

输入:蛋白质序列;

算法:通过比较目标蛋白与已知功能的蛋白质之间的相似性,然后采用一种相似性加权算法来预测目标蛋白的功能;

早期机器学习算法,效率低

2

2018年

DeepGO

Bioinformatics

输入:蛋白质序列和PPI网络;

算法:基于卷积神经网络(CNN)的深度学习分类模型,使用3-mer编码蛋白质序列,取序列特征。对于PPI网络,采用DeepWalk生成每个蛋白质的256维网络拓扑特征;

层次化分类网络需要巨大的内存资源,难以应用于大规模标签

3

2020年

DeepGOCNN

Bioinformatics

输入:蛋白质序列;

算法:从蛋白质序列中提取特征以预测功能,通过堆叠的CNN层来提取特征并预测蛋白质的功能

最大预测蛋白质长度为2000

4

2020年

DeepGOA

IEEE/ACMTransactionsonComputationalBiologyandBioinformatics

输入:蛋白质序列和PPI网络;

算法:使用Word2vec生成序列的残基级嵌入,然后输入到Bi-LSTM和多尺度CNN层中以提取全局和局部特征;

具有特殊特征的蛋白质功能无法预测,蛋白质序列最长为1000

5

2021年

DeepGraphGO

Bioinformatics

输入:蛋白质序列和PPI网络;

算法:端到端模型,利用GNNs从PPI网络中提取信息以预测蛋白质功能;

缺乏PPIs信息的新测序生物体难以预测

6

2021年

DeepFRI

NatureCommunications

输入:蛋白质序列和结构;

算法:融合了自监督语言模型和图卷积网络,从蛋白质序列的自监督模型中提炼出的序列特征及蛋白质结构来预测其功能;

蛋白质序列训练集局限于PDB

7

2022年

GAT-GO

BriefingsinBioinformatics

输入:蛋白质序列和结构;

算法:基于图注意力网络(GAT)的方法,它利用预训练的蛋白质序列语言模型。GAT-GO输入蛋白质序列,提取序列特征、残基级特

征和结构特征,从而预测功能;

对于长序列蛋白质,对蛋白质结构数据精度要求很高

8

2024年

DeepGO-SE

NatureMachineIntelligence

输入:蛋白质序列;

算法:使用预训练的大型语言模型从蛋白质序列预测GO功能,通过生成多个近似GO模型,并用神经网络预测蛋白质功能的真值;

当序列与PPIs结合时性能最佳,许多新蛋白质没有已知的相互作用限制了组合模型的应用

2.2

序号

时间

模型

团队

架构

应用范围

1

2018年

DNN-PPI

天津大学团队

DNN-PPI基于深度神经网络,包含卷积神经网络

(CNN)和长短期记忆(LSTM)两个独立的顺序层,从蛋白质序列中学习的特征以自动预测PPI。

预测蛋白质-蛋白质相互作用

3

2021年

AlphaFold-Multimer

DeepMind

基于深度学习,先建立复合物的多序列比对,以推断进化关系,然后用与AlphaFold2基本相同的深度学习方法来预测三级结构。

预测蛋白质复合物三维结构

2

2021年

EquiDock

麻省理工学院

EquiDock模型,假设蛋白质内的构象在结合过程中没有发生构象变化的情况下,在单个未结合的结构中计算预测蛋白质-蛋白质复合物的3D结构的模型。

预测蛋白质-蛋白质复合物结构

6

2022年

EquiBind

麻省理工学院

以EquiDock为基础,依赖SE(3)-等变图神经网络,以配体分子图的随机三维构象和受体结构作为输入,预测结合蛋白质配体构象。

预测蛋白质-小分子复合物结构

4

2022年

DeepTrio

浙江大学团队

DeepTrio是一种使用掩码多个并行卷积神经网络进行蛋白质-蛋白质相互作用的一个深度学习框架,它允许模型学习相对性质并研究每个残基对预测结果的贡献,并通过热图可视化蛋白质的重要性图。

预测蛋白质-蛋白质相互作用

5

2022年

UniFold-Multimer

深势公司团队

端对端的蛋白质复合物结构预测,输入蛋白质多聚体的一级结构),预测蛋白质的三级结构,同时给出预测结果的置信度。

预测蛋白质复合物结构

7

2022年

TANKBind

星药科技联合复旦大学、中山大学共同研发

基于图神经网络模型,用三维结合构象表示分子之间的几何关系,从而提高预测的准确性。

预测蛋白质-小分子配体结构

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档