深度学习在蛋白质功能预测中的应用
宋益东, 袁乾沐, 杨跃东

The application of deep learning in protein function prediction
Yidong SONG, Qianmu YUAN, Yuedong YANG
表2 结合位点预测最新方法总结
Tab. 2 The summary of the latest binding site prediction methods
方法

数据

来源

年份特征1算法是否开源2
蛋白-蛋白SPPIDER[45]PDB2007物理化学性质,基于MSA的进化信息,DSSP结构信息,dSA (预测的和真实RSA的差值)全连接神经网络S
SCRIBER[46]BioLip2019相对溶剂可及性,进化保守性,相对氨基酸结合倾向性,物理化学性质,内部无序性,二级结构,残基位置逻辑回归S
DELPHIPDB, BioLip2020高分值片段对,ProtVec1D,PSSM,进化保守性,相对溶剂可及性,相对氨基酸结合倾向性,亲水性,内部无序性,物理化学性质,PKx,位置信息CNN+GRUS, C
DeepPPISP[47]PDB2020PSSM,二级结构,one-hot蛋白序列CNNS, C
MaSIF[48]----2020表面几何与物理化学特征,如局部曲率、Poisson–Boltzmann静电、氢键供体或受体以及亲水性几何深度学习C
GraphPPISPDB2021PSSM,HMM,DSSPGCNS, C
蛋白-多肽SPRINT[49]PDB2016one-hot蛋白序列,PSSM,相对溶剂可及性,二级结构,物理化学性质SVMS
PepBind[50]BioLiP2018PSSM,HMM,二级结构,内部无序性SVM+ 基于模板的方法S
Visual[51]BioLiP2020PSSM,半球暴露,二级结构,溶剂可及性,扭转角,物理化学性质CNNC
BiteNetppBioLip2021体素化的11种原子密度3D CNNS, C
PepNNPDB2022残基间距离,Cα的相对方向,局部坐标系间旋转矩阵,残基的相对位置,one-hot蛋白序列,扭转骨架角,语言模型特征互注意力机制+GNNC
蛋白-核酸DNAPred[52]PDB2019PSSM,预测的二级结构和溶剂可及性,结合与非结合氨基酸的频率差SVMS
NucBind[53]PDB2019PSSM,HMM,预测的二级结构,预测结构SVM+COACH-D[54]S
NCBRPred[55]----2021PSSM,HMM,预测的二级结构和溶剂可及性GRUS, C
GraphBindBioLiP2021残基的原子特征,DSSP,PSSM,HMMGNNS, C
GraphSiteBioLiP2022AlphaFold2 single特征,PSSM,HMM,DSSPGraph TransformerS, C
蛋白-小分子或离子配体TargetS[56]PDB2013PSSM,预测的二级结构,相对氨基酸结合倾向性AdaBoostS
IonCom[19]BioLiP2016PSSM,预测的二级结构和溶剂可及性,保守性,氨基酸的离子结合频率,预测结构AdaBoost+SVM+ COFACTOR[57]+ S-SITE[18]+ TM-SITE[18]S, C
MIB[16]PDB2016结构模板数据Fragment TransformationS
DELIABioLip2020PSSM,HMM,二级结构,可溶性,S-SITE特征,基于结构的距离矩阵CNNS
LMetalSiteBioLiP2022语言模型特征Transformer+多任务学习S, C
综合不同类型配体MTDsiteBioLip2021PSSM,HMM,SPIDER3,溶剂可及性表面积,扭转角, 分界线内的残基数,半球暴露BiLSTM+多任务学习C
DeepDISOBindDisProt2022one-hot蛋白序列,相对氨基酸亲和性,二级结构,内部无序性CNN+多任务学习S, C