基于合成生物学策略的酶蛋白元件规模化挖掘
张建志, 付立豪, 唐婷, 张嵩亚, 朱静, 李拓, 王子宁, 司同

Scalable mining of proteins for biocatalysis via synthetic biology
ZHANG Jianzhi, FU Lihao, TANG Ting, ZHANG Songya, ZHU Jing, LI Tuo, WANG Zining, SI Tong
表1 酶元件资源数据库及链接
Tab. 1 Enzyme resource database and their corresponding links
蛋白质序列数据库基本信息

Uniprot

https://www.uniprot.org/

信息最丰富、资源最广的蛋白质数据库。由Swiss-Prot、TrEMBL和PIR-PSD三大数据库的数据组合而成

NCBI

https://www.ncbi.nlm.nih.gov/

Conserved Domains蛋白质保守结构域数据库,是关于蛋白质功能单元注释的资源
Protein包含GenBank,RefSeq,TPA,SwissProt,RIP,PDB等数据库中的序列
Protein cluster包括完整的原核生物基因组和叶绿体基因组编码的RefSeq蛋白质序列
Structure数据来源于PDB的蛋白质结构数据库,并将结构数据链接到书目信息、序列数据库和NCBI的Taxonomy中,运用3D结构浏览器和Cn3D,可以从Entrez获得分子间相互作用的图像

PDB

http://www.rcsb.org/

生物大分子(如蛋白质和核酸)数据库,包括由全世界生物学家和生物化学家上传的蛋白质或核酸的X射线晶体衍射或者NMR核磁共振结构数据。从PDB的网站上,可以通过蛋白质的编号查找到相应的3D结构,并通过PyMol、RasMol、Chimera、VMD、Swiss-PdbViewer等软件查看、编辑

InterPro

http://www.ebi.ac.uk/interpro/

整合了CATH、CDD、PRINTS、Pfam等多个数据库,并去掉冗余数据,对蛋白质家族预测、结构域和结合位点预测进行注释

Brenda

https://www.brenda-enzymes.org/

包括酶促反应、特异性、动力学参数、结构和稳定性等蛋白质功能数据及基因组序列信息

BKMS-react

http://bkm-react.tu-bs.de/

包括酶促反应、动力学参数、实验条件和代谢途径等信息

EzCatDb

http://ezcatdb.cbrc.jp/EzCatDB/

包括酶促反应、辅因子、中间代谢产物、催化活性结构域和结构等信息

M-CSAb

https://www.ebi.ac.uk/thornton-srv/m-csa/browse/

对催化残基、辅助因子和反应机理的注释

FireProt

https://loschmidt.chemi.muni.cz/fireprotdb/

包括序列突变后导致的热稳定性变化数据

ProTherm

https://www.iitm.ac.in/bioinfo/ProTherm/

包括序列突变后导致的热稳定性变化数据

eSOL

http://tanpaku.org/tp-esol/index.php?lang=en

基于蛋白质翻译和离心条件推测蛋白质溶解度

SoluProtMut

https://loschmidt.chemi.muni.cz/soluprotmutdb/

包括序列突变后导致的溶解性变化数据

TargetTrack

http://dx.doi.org/10.5281/zenodo.821654

蛋白质溶解性数据库

ProtaBank

https://protabank.org/

包括各种突变后的蛋白质序列信息

hPDB

http://hackage.haskell.org/package/hPDB

可动态展示生物大分子立体结构

KEGG

https://www.kegg.jp/

整合基因组、化学和系统功能信息的数据库。把从已经完整测序的基因组中得到的基因目录与更高级别的细胞、物种和生态系统水平的系统功能关联起来

PMD

http://www.proteinmicroarray.cn/

蛋白质突变数据库

Pfam

http://pfam.xfam.org/

蛋白质家族数据库,蛋白质家族以多序列比对和隐马尔科夫模型的形式表示

FIGFAMs

http://blog.theseed.org/servers

基于人工注释的来源于不同细菌,古菌等生物的蛋白质序列构成,同功能蛋白质组合为相应的集合

PRINTS

http://bioinf.man.ac.uk/dbbrowser/PRINTS

蛋白质Motif数据库

CATH

http://cathdb.info/

以蛋白质结构域层次组织的包含类型(C)、架构(A)、拓扑学(T)和同源超家族的数据库

SCOP

http://scop.mrc-lmb.cam.ac.uk/

蛋白质结构分类

CCDC

https://ccdc.cam.ac.uk/

剑桥晶体中心数据库

SWISS-3DIMAGE

http://us.expasy.org/sw3d/

蛋白质及其他生物分子的三维图像

BioMagResBank

http://www.bmrb.wisc.edu/

蛋白质、氨基酸和核苷酸的核磁共振数据库

SWISS-MODEL Repository

http://swissmodel.expasy.org/repository/

自动产生蛋白质模型的数据库

PROTOMAP

https://www.scripps.edu/cravatt/protomap/

Swiss-Prot蛋白质自动分类系统

iProClass

http://pir.georgetown.edu/iproclass/

蛋白质分类数据库

TIGRFAM

http://www.tigr.org/TIGRFAMs/

蛋白质家族数据库

OWL

http://www.bioinf.man.ac.uk/dbbrowser/OWL/

非冗余蛋白序列数据库,由SWISS-PROT、PIR、GenBank(由其编码序列翻译而成的氨基酸序列)和NRL-3D一级序列数据库集合而成

3DID

http://3did.irbbarcelona.org

包括3D结构已知的蛋白质的互作信息

DOMINE

http://manticore.niehs.nih.gov/cgi-bin/Domine

蛋白质结构域互作数据库

PiSite

http://pisite.hgc.jp

以PDB为基础,可在蛋白序列中搜寻互作位点

Binding MOAD

http://www.BindingMOAD.org

提供蛋白质-配体晶体结构数据信息

Phospho.ELM

http://phospho.elm.eu.org

蛋白质磷酸化位点数据库

STITCH

http://stitch.embl.de/

蛋白质-化合物作用网数据库

Reactome

http://www.reactome.org

人体生命活动路径与过程数据库,提供生化过程网络图,并对参与其中的蛋白质分子有详细注解,与其他数据库如UniPort、KEGG、OMIM等建立了广泛的交叉应用

UniHI

http://www.unihi.org

人体蛋白质-蛋白质相互作用数据库

Bionemo

http://bionemo.bioinfo.cnio.es

包括与生物降解代谢相关的蛋白质、基因数据,包括蛋白序列、结构域、结构;基因序列、调控元件、转录单元等信息。除此之外还包括生物降解的代谢路径图、相关生化反应等

CAZy

http://www.cazy.org/

碳水化合物活性酶数据库,包括能够合成或者分解复杂碳水化合物的酶类

LED

http://www.led.uni-stuttgart.de/

脂肪酶工程数据库,整合了脂肪酶的结构域序列信息

MEROPS

https://www.ebi.ac.uk/merops/

肽酶数据库,同时也包括一些蛋白质类肽酶抑制剂的信息

PLANT-PIs

http://plantpis.ba.itb.cnr.it/

植物蛋白酶抑制剂及相关基因信息

PROSPER

https://prosper.erc.monash.edu.au

基于序列预测24个不同蛋白酶家族的催化底物和切割位点

CPDB

140.113.15.73/~lab/deprecated/cpdb-2009/

利什曼原虫中半胱氨酸蛋白酶注释数据库

SABIO-RK

http://sabio.h-its.org/

包括生化反应动力学参数的数据库