Fig. 18
AI/ML drives the intelligent evolution of halogenase[138-156]
Extracts from the Article
传统酶工程策略(如定向进化、理性设计)受限于机理认知不足与实验通量限制,难以系统性解决上述挑战。近年来,AI/ML技术的快速发展为卤化酶研究提供了全新范式。通过整合多维度数据(序列、结构、反应)与先进算法,AI/ML技术有望突破传统经验驱动的研究局限,推动卤化酶研究进入新阶段,实现从基因挖掘、结构设计到工业适配的全链条智能化改造。结合当下发展趋势[138-151],本文提出一种基于AI/ML的多模态计算框架[图18(a)],旨在通过跨学科大数据的整合、处理与分析[152-156],为卤化酶的理性设计与功能优化提供系统性支持:
1)卤化酶基因智能挖掘。AI/ML技术通过整合大规模基因组数据与生物信息学方法,正在革新卤化酶基因资源的开发模式[图18(b)]。基于深度学习的预训练模型高效识别天然产物生物合成基因簇(BGCs)中的保守序列特征(如铜结合基序HXXHC、FADH2结合基序GxGxxG等),精准定位潜在卤化酶基因位点。针对氟/碘化酶稀缺性问题[30],迁移学习策略通过共享氟化酶与碘化酶的序列-结构-功能特征,构建卤素特异性分类模型,提升新型C-F/C-I键催化酶的筛选效率。未来需开发跨物种基因表达谱的对比学习框架,解析底物结合域的演化规律,为卤化酶多样性挖掘提供新范式。
4)工业催化系统的适配性优化.AI/ML技术为卤化酶的工业应用提供系统性解决方案.基于机器学习的耐受性预测模型通过分析残基理化性质(如溶剂可及性、氢键网络密度),筛选耐受极端反应条件(高pH、有机溶剂)的酶突变体.强化学习算法通过动态调节pH、温度及底物流速,优化连续流反应器的过程控制精度.多酶级联路径的智能规划工具整合代谢通量分析与过渡态能垒评估,自主生成高效催化序列组合.此外,AI驱动的界面设计策略可优化酶固定化载体的电荷互补性,提升传质效率与操作稳定性,为规模化生产奠定基础.此外,跨学科数据平台的建设将整合序列-结构-动力学-工艺参数,为AI模型提供标准化训练集,推动卤化酶设计从“试错迭代”向“预测验证”的范式转变. ... A nucleobase-driven P450 peroxidase system enables regio-and stereo-specific formation of C-C and C-N bonds 0 2024 Efficient and accurate prediction of protein structure using RoseTTAFold2 0 2023 Modeling protein-small molecule conformational ensembles with ChemNet 0 2024 Efficient generation of protein pockets with PocketGen 0 2024 MEnTaT: A machine-learning approach for the identification of mutations to increase protein stability 0 2023 Ab initio characterization of protein molecular dynamics with AI2BMD 0 2024 De novo protein design-From new structures to programmable functions 0 2024 De novo design of luciferases using deep learning 0 2023 Scaffolding protein functional sites using deep learning 0 2022 De novo design of protein structure and function with RFdiffusion 1 2023 ... 3)卤化酶定向进化与从头设计.AI/ML技术通过生成式设计与多目标优化策略,推动卤化酶工程从经验驱动迈向理性设计范式.基于深度学习的蛋白质生成模型(如LigandMPNN、RFdiffusionAA及AlphaFold3等)围绕预设催化过渡态构建功能性酶骨架[138,148-149,151],突破天然底物限制.蛋白质语言模型(如ProteinMPNN)通过序列-结构映射关系优化活性口袋的拓扑构型[150],提升底物结合特异性与催化效率.此外,多目标优化算法通过平衡酶稳定性、底物谱兼容性及催化活性等竞争性参数,指导全局最优突变组合的筛选.未来需开发基于主动学习的适应性进化框架,与RosettaMatch、Combs、Riff-Diff等从头设计算法对接[152],动态探索酶适应度景观的高活性区域,实现催化功能的精准定制及从头设计. ... Generalized biomolecular modeling and design with RoseTTAFold All-Atom 1 2024 ... 3)卤化酶定向进化与从头设计.AI/ML技术通过生成式设计与多目标优化策略,推动卤化酶工程从经验驱动迈向理性设计范式.基于深度学习的蛋白质生成模型(如LigandMPNN、RFdiffusionAA及AlphaFold3等)围绕预设催化过渡态构建功能性酶骨架[138,148-149,151],突破天然底物限制.蛋白质语言模型(如ProteinMPNN)通过序列-结构映射关系优化活性口袋的拓扑构型[150],提升底物结合特异性与催化效率.此外,多目标优化算法通过平衡酶稳定性、底物谱兼容性及催化活性等竞争性参数,指导全局最优突变组合的筛选.未来需开发基于主动学习的适应性进化框架,与RosettaMatch、Combs、Riff-Diff等从头设计算法对接[152],动态探索酶适应度景观的高活性区域,实现催化功能的精准定制及从头设计. ... Robust deep learning–based protein sequence design using ProteinMPNN 1 2022 ... 3)卤化酶定向进化与从头设计.AI/ML技术通过生成式设计与多目标优化策略,推动卤化酶工程从经验驱动迈向理性设计范式.基于深度学习的蛋白质生成模型(如LigandMPNN、RFdiffusionAA及AlphaFold3等)围绕预设催化过渡态构建功能性酶骨架[138,148-149,151],突破天然底物限制.蛋白质语言模型(如ProteinMPNN)通过序列-结构映射关系优化活性口袋的拓扑构型[150],提升底物结合特异性与催化效率.此外,多目标优化算法通过平衡酶稳定性、底物谱兼容性及催化活性等竞争性参数,指导全局最优突变组合的筛选.未来需开发基于主动学习的适应性进化框架,与RosettaMatch、Combs、Riff-Diff等从头设计算法对接[152],动态探索酶适应度景观的高活性区域,实现催化功能的精准定制及从头设计. ... Atomic context-conditioned protein sequence design using LigandMPNN 2 2023 ... 传统酶工程策略(如定向进化、理性设计)受限于机理认知不足与实验通量限制,难以系统性解决上述挑战.近年来,AI/ML技术的快速发展为卤化酶研究提供了全新范式.通过整合多维度数据(序列、结构、反应)与先进算法,AI/ML技术有望突破传统经验驱动的研究局限,推动卤化酶研究进入新阶段,实现从基因挖掘、结构设计到工业适配的全链条智能化改造.结合当下发展趋势[138-151],本文提出一种基于AI/ML的多模态计算框架[图18(a)],旨在通过跨学科大数据的整合、处理与分析[152-156],为卤化酶的理性设计与功能优化提供系统性支持: ...
Other Images/Table from this Article
|